将包含数据列的行转换为Excel 2007中具有多行的列

问题描述 投票:2回答:5

我有一行数据如下:

            header1      header2      header3      header4      header5
row key     datavalue1   datavalue2   datavalue3   datavalue4   datavalue5....

所以基本上,我有一个非规范化的数据集,其中数据值可能是逐行的,也可能不是空的。我需要将它们标准化。

12345678    NULL         10           3            NULL         14

会成为:

12345678   header2   10
12345678   header3   3
12345678   header5   14

我可以通过使用粘贴特殊转换来实现这一点,但我有数千行,我需要确保每个都获得正确的行键。此外,每行都有一堆与之关联的描述,我需要将每个数据值复制一遍。

转换每一列的最简单方法是什么,以便我有一个单行的多行,所有非空数据值加上相关的数据值引用?我需要能够转动数据集。

excel vba pivot-table database-normalization
5个回答
3
投票

如果您有五个“标题”列,请输入这些公式

H1: =OFFSET($A$1,INT((ROW()-1)/5)+1,0)
I1: =OFFSET($A$1,0,IF(MOD(ROW(),5)=0,5,MOD(ROW(),5)))
J1: =INDEX($A$1:$F$9,MATCH(H1,$A$1:$A$9,FALSE),MATCH(I1,$A$1:$F$1,FALSE))

复制H1:J ??并在顶部粘贴特殊值。在列J上排序并删除任何零。如果数据中有合法的零,那么首先需要用一些唯一的字符串替换空白单元格,然后再将其删除。

如果您有更多列,则将所有上述公式中的“5”替换为您拥有的任何数字。


1
投票

在我看来,你要做的部分就是“解旋”一个数据透视表。当我不得不做类似的任务时,我发现这个提示是一个巨大的帮助:http://spreadsheetpage.com/index.php/tip/creating_a_database_table_from_a_summary_table/

请注意,在Excel 2007中,您可以使用按键Alt + D,P转到旧的Excel 2003数据透视表向导。


1
投票

Excel具有转置功能,可满足您的需求。它非常隐蔽,有点笨拙,但可能比钻研VBA更容易。以下是Excel 2007帮助的摘录:

Blockquote Switch(转置)列和行显示AllHide All如果在列或行中输入数据,但您希望将数据重新排列为行或列,则可以快速将数据从一个转换为另一个。

例如,按列组织的区域销售数据在转置数据后显示在行中,如下图所示。

1.在工作表上,执行以下操作:要将数据从列重新排列到行,请选择包含数据的列中的单元格。要从行重新排列数据,请选择包含数据的行中的单元格。 2.在“主页”选项卡上的“剪贴板”组中,单击“复制”。

键盘快捷键要复制所选数据,还可以按CTRL + C.

注意您只能使用“复制”命令重新排列数据。要成功完成此过程,请不要使用“剪切”命令。

3.在工作表上,选择要重新排列复制数据的目标行或列的第一个单元格。注意复制区域(复制区域:当您要将数据粘贴到另一个位置时复制的单元格。复制单元格后,它们周围会出现一个移动边框,表示它们已被复制。)并粘贴区域(粘贴区域:使用Office剪贴板剪切或复制的数据的目标目标。)不能重叠。确保在粘贴区域中选择一个位于复制数据区域之外的单元格。

4.在“主页”选项卡上的“剪贴板”组中,单击“粘贴”下方的箭头,然后单击“转置”。 5.数据转换成功后,您可以删除复制区域中的数据。提示如果转置的单元格包含公式,则会调换公式,并自动调整对转置单元格中数据的单元格引用。要确保公式继续正确引用非转置单元格中的数据,请在转置它们之前在公式中使用绝对引用。

有关更多信息,请参阅在相对,绝对和混合引用之间切换。

大段引用


0
投票

让我们看一下VBA中可能的解决方案。我认为这会有所帮助。以下是您应该了解的有关我的代码的一些事项。

  • 您需要将此代码放在VBA中的代码模块中(与Macros相同的位置)
  • 看看我命名的表格:原始和标准化。您要么想要更改工作表名称或代码
  • 我正在使用字符串字段NULL检查值。如果单元格为空,则需要检查If IsEmpty(rngCurrent.Value) Then

'

Sub NormalizeSheet()
Dim wsOriginal As Worksheet
Dim wsNormalized As Worksheet
Dim strKey As String
Dim clnHeader As Collection
Dim lngColumnCounter As Long
Dim lngRowCounterOriginal As Long
Dim lngRowCounterNormalized As Long
Dim rngCurrent As Range
Dim varColumn As Variant

Set wsOriginal = ThisWorkbook.Worksheets("Original")     'This is the name of your original worksheet'
Set wsNormalized = ThisWorkbook.Worksheets("Normalized") 'This is the name of the new worksheet'
Set clnHeader = New Collection

wsNormalized.Cells.ClearContents        'This deletes the contents of the destination worksheet'

lngColumnCounter = 2
lngRowCounterOriginal = 1
Set rngCurrent = wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter)

' We'll loop through just the headers to get a collection of header names'
Do Until IsEmpty(rngCurrent.Value)
    clnHeader.Add rngCurrent.Value, CStr(lngColumnCounter)
    lngColumnCounter = lngColumnCounter + 1
    Set rngCurrent = wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter)
Loop

'Here we'll reset our Row Counter and loop through the entire data set'
lngRowCounterOriginal = 2
lngRowCounterNormalized = 1
lngColumnCounter = 1

Do While Not IsEmpty(wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter))

    Set rngCurrent = wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter)
    strKey = rngCurrent.Value ' Get the key value from the current cell'
    lngColumnCounter = 2

    'This next loop parses the denormalized values for each row'
    Do While Not IsEmpty(wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter))
        Set rngCurrent = wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter)

        'We're going to check to see if the current value'
        'is equal to NULL. If it is, we won't add it to'
        'the Normalized Table.'
        If rngCurrent.Value = "NULL" Then
            'Skip it'
        Else
            'Add this item to the normalized sheet'
            wsNormalized.Range("A" & lngRowCounterNormalized).Value = strKey
            wsNormalized.Range("B" & lngRowCounterNormalized).Value = clnHeader(CStr(lngColumnCounter))
            wsNormalized.Range("C" & lngRowCounterNormalized).Value = rngCurrent.Value
            lngRowCounterNormalized = lngRowCounterNormalized + 1
        End If

        lngColumnCounter = lngColumnCounter + 1
    Loop
    lngRowCounterOriginal = lngRowCounterOriginal + 1
    lngColumnCounter = 1    'We reset the column counter here because we're on a new row'
Loop



End Sub

0
投票

我会创建一个VBA宏,循环遍历每一行并将数据输出到另一页。这样,您可以在数据输出后在新页面中创建数据透视表。

不确定你对VBA的熟悉程度,但是通过将数据加载到数组(或者如果你真的想要正确地执行它的对象集合)并将其写回来,可以很容易地完成。

这是一个很好的VBA文档的链接。

http://social.msdn.microsoft.com/Forums/en/isvvba/thread/d712dbdd-c876-4fe2-86d2-7d6323b4262c

编辑

请注意,这并不是一个完全可行的解决方案,而是一个真正的通用框架,可以帮助您朝着正确的方向前进。

作为一个通用的例子,它可以完成你需要做的很多事情(不是最好的方式,但对于一个初学者来说可能是最简单的),这样的事情应该让你开始,虽然很难说没有看到更多你的工作表。

Sub RowsToColumns ()
  Application.ScreenUpdating = False
  Dim srcWrkSheet As Worksheet
  Dim destWrkSheet As Worksheet
  Dim excelData as pExcelData
  Dim srcRowNumber As Long
  Dim srcRolNumber As Long
  Dim destRowNumber As Long
  Dim destColNumber As Long

  SET srcWrkSheet = Sheets("YourSourceWorkSheetName")
  SET destWrkSheet = Sheets("YourDestinationWorkSheetName")

  srcRowNumber = 1
  srcColNumber = 1
  destRowNumber = 1
  destColNumber = 1

  'Loop until blank row is encountered in column 1
  Do
    destWrkSheet.Cells(destRowNumber ,1).Value = "Header 1 " & srcWrkSheet.Cells(srcRowNumber,srcColNumber )
    destWrkSheet.Cells(destRowNumber ,1).Value = "Header 2 " & srcWrkSheet.Cells(srcRowNumber ,srcColNumber)

    srcRowNumber = srcRowNumber + 1
    srcColNumber = srcColNumber + 1
    destRowNumber = destRowNumber  + 1
  Loop Until srcWrkSheet .Cells(rowNumber, 1).value = ""

End Sub
© www.soinside.com 2019 - 2024. All rights reserved.