我得到了一个 CSV 文件(流行性感冒)来打开并找到我想要处理的数据。我需要找到 NC 状态的平均活动水平。
我可以将活动级别和年份提取到列表中,但是,我希望我的代码的后半部分找到“target_year”的所有活动级别并删除数字前面的“级别”,这样我就可以得到平均。
import csv
import matplotlib.pyplot as plt
with open('influenza (2).csv', 'r') as influenza_file:
contents_1 = csv.reader(influenza_file)
rows = []
row_count = 1
for row in contents_1:
if 16259 <= row_count <= 16751:
columns_selected = [row[3], row[7]]
rows.append(columns_selected)
row_count += 1
for row in rows:
print(row)
target_year = ['2013-14', '2014-15', '2015-16', '2016-17', '2017-18', '2018-19', '2019-20', '2020-21', '2021-22']
level_influenza = []
for year in target_year:
for row in rows:
if row[1] == year and row[0] == 'Level':
level_influenza.append(row[0].replace('Level ', ''))
print(level_influenza)
所以 2015-16 年将有多个活动级别 (1-13) 的条目,它们会重复,我想将这些条目存储到给定年份的列表中。
我所拥有的示例输出(请记住,这要长得多):
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 3', '2016-17']
['Level 4', '2016-17']
['Level 7', '2016-17']
['Level 10', '2016-17']
['Level 5', '2016-17']
['Level 10', '2016-17']
['Level 10', '2016-17']
['Level 10', '2016-17']
['Level 10', '2016-17']
['Level 10', '2016-17']
['Level 10', '2016-17']
['Level 5', '2016-17']
['Level 4', '2016-17']
['Level 2', '2016-17']
['Level 2', '2016-17']
['Level 3', '2016-17']
['Level 3', '2016-17']
['Level 2', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 1', '2016-17']
['Level 2', '2015-16']
['Level 1', '2015-16']
['Level 1', '2015-16']
['Level 1', '2015-16']
['Level 1', '2015-16']
['Level 1', '2015-16']
['Level 1', '2015-16']
...