通过识别列值对二维数组行进行分组,并将递增的数字附加到后续分组数据的键中

问题描述 投票:0回答:4

我有一个巨大的数组作为搜索结果返回,我想要执行以下操作:

遍历数组,并为具有相同“spubid”的每个记录添加以下键/值:“sfirst、smi、slast”到父数组成员(在本例中为 $a[0])。因此,结果将保持 $a[0] 不变,但添加来自数组中其他成员的 sfirst、smi 和 slast 的值(因为它们都具有相同的“spubid”)。我认为将键值 (1, 2, 3) 添加到关联键 (sfirst1=> "J.", smi1=>"F.", slast1=>"Kennedy") 就可以了。然后我想用“spubid”删除(unset())数组中的其余成员。这是我返回的数组的简化示例,在此示例中,所有记录都具有相同的“spubid”:

Array ( 
  [0] => 
    Array ( 
      [spubid] => A00502 
      [sfirst] => J. 
      [smi] => A. 
      [slast] => Doe
  [1] => 
    Array ( 
      [spubid] => A00502 
      [sfirst] => J. 
      [smi] => F. 
      [slast] => Kennedy 
  [2] => 
    Array ( 
      [spubid] => A00502 
      [sfirst] => B. 
      [smi] => F. 
      [slast] => James 
  [3] => 
    Array ( 
      [spubid] => A00502
      [sfirst] => S. 
      [smi] => M. 
      [slast] => Williamson 
      )
    )

所以本质上我想保留 $a[0] 但添加新的键=>值到它(sfirst$key,smi$key,slast$key)并附加来自所有的“sfirst,smi,slast”的值具有相同“spubid”的成员然后取消设置 $a[1]-[3]。

只是为了澄清我理想的最终结果是:

Array ( 
  [0] => 
    Array ( 
      [spubid] => A00502 
      [sfirst] => J. 
      [smi] => A. 
      [slast] => Doe
      [sfirst1] => J.
      [smi1] => F. 
      [slast1] => Kennedy
      [sfirst2] => B. 
      [smi2] => F. 
      [slast2] => James 
      [sfirst3] => S. 
      [smi3] => M. 
      [slast3] => Williamson
    )
  )

在大多数情况下,我会从一个更大的数组开始,其中包括大量“spubid”,但 99% 的出版物有多个作者,因此这个例程对于清理结果和进行解析非常有用显示过程更加容易。

***更新

我认为过度简化我的例子可能会让事情变得不清楚。我喜欢 Chacha102 和 zombat 的响应,但我的“父数组”包含的不仅仅是 pubid,它恰好是主键。我需要保留该记录中的许多其他数据,其中一小部分如下:

[spubid] => A00680 
[bactive] => t 
[bbatch_import] => t 
[bincomplete] => t 
[scitation_vis] => I,X 
[dentered] => 2009-08-03 12:34:14.82103 
[sentered_by] => pubs_batchadd.php 
[drev] => 2009-08-03 12:34:14.82103 
[srev_by] => pubs_batchadd.php 
[bpeer_reviewed] => t 
[sarticle] => A case study of bora-driven flow and density changes on the Adriatic shelf (January 1987)
.
.
.
.
.

每个搜索查询都会返回大约 40 列。我如何在包含它们的同时仍然按照你们的建议进行更改,而不是像这些示例对 pubid 那样对它们进行硬编码。创建一个多维数组(正如你们俩所建议的那样)并且作者是多维的一部分是完全可以的,谢谢你们的建议。

**** 更新:

这是我确定的解决方案,非常简单并且很好地完成了工作。我最终创建了一个多维数组,因此作者在那里被打破了。

过于简化的解决方案:

$apubs_final = array();
$spubid = NULL;
$ipub = 0;

foreach($apubs as $arec)
{
  if($spubid != $arec['spubid'])
  {
    $ipub++;
    $apubs_final[$ipub] = $arec;
    // insert UNSET statements here for author data
    $iauthor = 0;
    $spubid = $arec['spubid'];
  }
  $iauthor++;
  $apubs_final[$ipub]['authors'][$iauthor]['sauthor_first'] = $arec['sfirst'];
}
php arrays multidimensional-array append grouping
4个回答
3
投票
// First, probably the more parsable way.
foreach($array as $key => $values)
{
    $end[$spuid] = $values;
    $spuid = $values['spuid']
    $end[$spuid]['authors'][] = array('sfirst' => $values['sfirst'],
                          'smi' => $values['smi'],
                           'slast' => $values['slast']);

}

这会得到这样的数组

Array(
    [A00502] =>
         Array(
           [supid] => A00502
               .... other values .....
           [authors] =>
                 Array(
                [0]=>
                      Array(
                    ['sfirst'] => '',
                    ['smi'] => '',
                    ['slast'] => '')
                )
        )
)

如果您打算在页面上显示它,我发现这种方法更易于解析,因为它使用数组,因此您可以查找作者,这就是我看到很多人对类似属性执行此操作的方式。

如果您确实想要理想的格式,请稍后使用此

$count = 0;
foreach ($end as $supid => $values)
{
    $other_end[$count] = $values;
    $other_end[$count]['spuid'] = $spuid;
    foreach($values['authors'] as $key => $author)
    {
        if($key == 0)
        {
            $suffix = '';
        }
        else
        {
            $suffix = $key;
        }
        $other_end[$count]['sfirst'.$suffix] = $author['sfirst'];
        $other_end[$count]['smi'.$suffix] = $author['smi'];
        $other_end[$count]['slast'.$suffix] = $author['slast'];
    }

}

2
投票

为什么不创建一个以 spubid 为键的数组:

// assuming $array is your array:

$storage = array();
foreach($array as $entry) {
  $bid = $entry['spubid'];
  if (!isset($storage[$bid])) {
    // duplicate entry - taking the author out of it.
    $stortmp = $entry;
    unset($stortmp['sfirst'], $stortmp['smi'], $stortmp['slast']);
    // add an authors array
    $stortmp['authors'] = array();
    $storage[$bid] = $stortmp;
  }
  $author = array(
    'sfirst' => $entry['sfirst'], 
    'smi' => $entry['smi'], 
    'slast' => $entry['slast']);
  $storage[$bid]['authors'][] = $author;
}

现在你的 $storage 数组应该如下所示:

Array(
  "A00502" => Array(
    "spubid" => "A00502",
    "authors" => Array(
      [0] => 
        Array ( 
          [sfirst] => J. 
          [smi] => A. 
          [slast] => Doe
       [1] => 
         Array ( 
          [sfirst] => J. 
          [smi] => F. 
          [slast] => Kennedy

您可以轻松地对作者进行 foreach 来打印它们:

foreach ($storage as $pub) {
  echo 'Pub ID: '.$pub['spubid']."<br/>";
  foreach ($pub['authors'] as $author) {
    echo 'Author: '.$author['sfirst'].' '.$author['smi'].' '.$author['slast']."<br/>";
  }
}

作为额外奖励,您可以访问

$storage['A00502']

已更新评论

您的数组可能来自某种涉及从出版物表到作者表的 JOIN 的 SQL 查询。这使得您的结果数据集重复了许多实际上并不需要的信息。没有理由多次从数据库传输/检索所有发布数据。尝试重写它以获取要显示的所有书籍的查询,然后使用“作者”查询执行以下操作:

SELECT * FROM authors WHERE spubid IN ('A00502', 'A00503', 'A00504');

然后将其转换为该数组以用于您的显示目的。您的数据库流量水平将会感谢您。


1
投票

此代码应该完全按照您指定的方式工作。我采用了使用几个临时数组来在主数组键和

spubid
子键之间建立关联的方法。

/* assume $array is the main array */
$array = array(
    array('spubid' => 'A00502','sfirst'=>'J.','smi'=>'A.','slast'=>'Doe'),
    array('spubid' => 'A00502','sfirst'=>'J.','smi'=>'F.','slast'=>'Kennedy'),
    array('spubid' => 'A00502','sfirst'=>'B.','smi'=>'F.','slast'=>'James'),
    array('spubid' => 'BXXXXX','sfirst'=>'B.','smi'=>'F.','slast'=>'James'),
    array('spubid' => 'A00502','sfirst'=>'S.','smi'=>'M.','slast'=>'Williamson')
);

//track spubid positions in the main array
$keyPositions = array();
//keys to delete after array iteration
$keyDel = array();
//track how many spubkey increments you've made to the fields
$spubKeys = array();
//fields to copy between spubids
$copyFields = array('sfirst','smi','slast');

foreach($array as $key => $subarr)
{
    if (isset($subarr['spubid'])) {
        if (isset($keyPositions[$subarr['spubid']])) {
            //spubid already exists at a main array key, do the copy
            $spubKey = ++$spubKeys[$subarr['spubid']];
            foreach($copyFields as $f) {
                $array[$keyPositions[$subarr['spubid']]][$f.$spubKey] = $subarr[$f];
            }
            $keyDel[] = $key;
        }
        else {
            //First time encountering this spubid, mark the position
            $keyPositions[$subarr['spubid']] = $key;
            $spubKeys[$subarr['spubid']] = 0;
        }
    }
}
if (count($keyDel)) {
    foreach($keyDel as $idx) unset($array[$idx]);
}

var_dump($array);

0
投票

分配引用以避免跟踪组数据被推入结果数组的位置。还维护一个计数器变量来确定是否应将整数附加到随后遇到的数据集的键上以及应附加什么整数。

代码:(演示

$result = [];
foreach ($array as $row) {
    $id = $row['spubid'];
    if (!isset($ref[$id])) {
        $ref[$id] = $row;
        $counter[$id] = 0;
        $result[] = &$ref[$id];  // push group reference into result array
    } else {
        unset($row['spubid']);
        ++$counter[$id];
        foreach ($row as $k => $v) {
            $ref[$id][$k . $counter[$id]] = $v; // push assoc elements into group reference
        }
    }
}
var_export($result);

就我个人而言,我发现这是一个 XY 问题——您可能不应该附加数字来表达子组。在专业应用程序中,我会使用更深的子数组(每组)。

© www.soinside.com 2019 - 2024. All rights reserved.