如何从python中的文本数据中提取特征?

问题描述 投票:-1回答:1

我正在尝试建立一个机器学习算法来预测一个人根据大脑的eeg信号思考的数字。我找到的数据集以文本格式提供,并被描述为 - “数据以非常简单的文本格式存储包含:

[是]:数字,仅供参考。

[event] id,一个整数,用于区分在不同大脑位置捕获的相同事件,仅由多通道设备使用(除了MW以外)。

[device]:一个2字符串,用于识别用于捕获信号的设备,用于MindWave的“MW”,用于Emotive Epoc的“EP”,用于Interaxon Muse的“MU”和用于Emotiv Insight的“IN”。

[channel]:一个字符串,用于标识信号的10/20大脑位置,可能的值:

MindWave“FP1”EPOC“AF3,”F7“,”F3“,”FC5“,”T7“,”P7“,”O1“,”O2“,”P8“,”T8“,”FC6“,”F4 “,”F8“,”AF4“Muse”TP9,“FP1”,“FP2”,“TP10”Insight“AF3,”AF4“,”T7“,”T8“,”PZ“

[code]:一个整数,用于识别被认为/看过的数字,可能的值为0,1,2,3,4,5,6,7,8,9或-1,用于随机捕获的信号与任何数字。

[size]:一个整数,用于识别在此信号的2秒内捕获的值的大小,因为每个设备的Hz变化,在“理论”中,MW的值接近512Hz,EP的值为128Hz,220Hz对于MU和128Hz的IN,每2秒钟。

[数据]:一组彗星分离的数字,具有信号的时间序列幅度,每个设备使用不同的精度来识别从大脑捕获的电位:MW和MU情况下的整数或者EP&IN案例。

文件中没有标题,每一行都是一个信号,字段由一个标签分隔“如何使用这些数据(绘制数据,在其上训练不同的模型)?我应该将其转换为另一种格式吗?如果是,那怎么样?数据集的链接-http://www.mindbigdata.com/opendb/MindBigData-MW-v1.0.zip

我已经将csv文件用于类似的ml项目但不知道如何使用这个,因为在每个信号的数据之前有一个单独的标题如何提取这些信号

database python-3.x machine-learning dataset
1个回答
0
投票

这些字段是制表符分隔的,你只需要[code](数字)或第5个字段,[data]第7个字段(一旦你提取它,就分开了)

© www.soinside.com 2019 - 2024. All rights reserved.