如何将IP转换为向量值

问题描述 投票:3回答:1

我有一个数据集

在机器学习中,我们使用Tf-Idf根据文本数据制作矢量

但是我无法在Tf-idf中传递此值

这里是数据

   remote_ip            datetime1              user_name
   192.168.1.19     2020-01-01 11:00:03          RON
   192.168.1.14     2020-01-01 11:00:04          JOHN
   192.168.1.195    2020-01-01 11:00:05          SAM
   192.168.1.120    2020-01-01 11:00:06          PILL
   192.168.1.119    2020-01-01 11:00:07          ARR
   192.168.1.119    2020-01-01 11:00:08          ARR

这是我想做的

我手动设置所有这些值(向量类型值)(这样您就可以理解我想要的东西)

 remote_ip    datetime1         user_name
-0.7843         -0.1231          -0.5232
 0.2313         -0.4232          -0.5833
 0.3451         -0.1243          -0.5239
-0.5618         -0.1234          -0.6735
-0.2134         -0.1235          -0.5236
-0.2134         -0.5236          -0.5238

第一次询问错误,所以请忽略错误(也许有一些格式错误,并且全部)

将不胜感激

谢谢

python pandas numpy scikit-learn tf-idf
1个回答
0
投票
    您应该将日期转换为引用(年,月,日,小时,分钟,秒,秒)的列
  • 用户名的标签编码
  • 将IP转换为4列。
  • 并且在这种情况下,您不需要使用tf-idf,因为所有值都是数字,并且对建模有效
  • © www.soinside.com 2019 - 2024. All rights reserved.