我正在尝试建立一个机器学习算法来预测一个人根据大脑的eeg信号思考的数字。我找到的数据集以文本格式提供,并被描述为 - “数据以非常简单的文本格式存储包含:
[是]:数字,仅供参考。
[event] id,一个整数,用于区分在不同大脑位置捕获的相同事件,仅由多通道设备使用(除了MW以外)。
[device]:一个2字符串,用于识别用于捕获信号的设备,用于MindWave的“MW”,用于Emotive Epoc的“EP”,用于Interaxon Muse的“MU”和用于Emotiv Insight的“IN”。
[channel]:一个字符串,用于标识信号的10/20大脑位置,可能的值:
MindWave“FP1”EPOC“AF3,”F7“,”F3“,”FC5“,”T7“,”P7“,”O1“,”O2“,”P8“,”T8“,”FC6“,”F4 “,”F8“,”AF4“Muse”TP9,“FP1”,“FP2”,“TP10”Insight“AF3,”AF4“,”T7“,”T8“,”PZ“
[code]:一个整数,用于识别被认为/看过的数字,可能的值为0,1,2,3,4,5,6,7,8,9或-1,用于随机捕获的信号与任何数字。
[size]:一个整数,用于识别在此信号的2秒内捕获的值的大小,因为每个设备的Hz变化,在“理论”中,MW的值接近512Hz,EP的值为128Hz,220Hz对于MU和128Hz的IN,每2秒钟。
[数据]:一组彗星分离的数字,具有信号的时间序列幅度,每个设备使用不同的精度来识别从大脑捕获的电位:MW和MU情况下的整数或者EP&IN案例。
文件中没有标题,每一行都是一个信号,字段由一个标签分隔“如何使用这些数据(绘制数据,在其上训练不同的模型)?我应该将其转换为另一种格式吗?如果是,那怎么样?数据集的链接-http://www.mindbigdata.com/opendb/MindBigData-MW-v1.0.zip
我已经将csv文件用于类似的ml项目但不知道如何使用这个,因为在每个信号的数据之前有一个单独的标题如何提取这些信号
这些字段是制表符分隔的,你只需要[code](数字)或第5个字段,[data]第7个字段(一旦你提取它,就分开了)