内存速度 | 设备重量 | 屏幕尺寸 | GPU内存类型 | GPU内存大小 | GPU类型 | 面板类型 | 处理器一代 | 处理器 | 操作系统 | 读卡器 | 背光键盘 | 最大处理器速度 | 最大屏幕分辨率 | 指纹读取器 | RAM(系统内存) | SSD容量 | 产品型号 | 价格 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2666兆赫 | 2 - 4 公斤 | 15.6英寸 | 机上 | 共享 | 集成显卡 | LED | 第10代 | 1005G1 | Windows 11 家庭版 | 无 | 0 | 3.4GHz | 1920×1080 | 无 | 4GB | 256GB | 笔记本 | 非常低 |
我有一个像 upside 这样的数据集。数据集格式为 xlsx 文件。我现在正在做数据预处理。我必须找到平均数、中位数、模数。 “对数据集进行描述性数据分析涉及检查记录计数、属性编号、属性类型、集中趋势度量、中心分散度量,并生成五数摘要” 一定的解释:)
现在我想问如何根据我的数据集找到对象数据类型的平均值? 背光键盘列的平均值现在只有我能找到。
import pandas as panda
dataset = panda.read_excel('data.xlsx')
print(dataset.info())
RangeIndex:994 个条目,0 到 993 数据列(共19列):
列名称 | 非空计数 | D型 |
---|---|---|
内存速度 | 888 | 物体 |
设备重量 | 985 | 物体 |
屏幕尺寸 | 994 | 物体 |
GPU内存类型 | 884 | 物体 |
GPU内存大小 | 946 | 物体 |
GPU类型 | 955 | 物体 |
面板类型 | 994 | 物体 |
处理器一代 | 946 | 物体 |
处理器 | 979 | 物体 |
操作系统 | 994 | 物体 |
读卡器 | 864 | 物体 |
背光 | 994 | int64 |
最大处理器速度 | 950 | 物体 |
最大屏幕分辨率 | 988 | 物体 |
指纹识别器 | 886 | 物体 |
RAM(系统内存) | 987 | 物体 |
SSD容量 | 991 | 物体 |
产品型号 | 994 | 物体 |
价格 | 994 | 物体 |
dataset.head()的结果:
内存速度 | 设备重量 | 屏幕尺寸 | 显卡内存类型 | 显卡内存 | 显卡类型 | 屏幕面板类型 | 处理器一代 | 处理器 | 操作系统 | 读卡器 | 背光键盘 | 最大处理器速度 | 最大屏幕分辨率 | 指纹识别器 | RAM(系统内存) | SSD容量 | 产品型号 | 价格 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1066兆赫 | NaN | 10英寸 | NaN | 1GB | NaN | IPS | 第一代 | 1000M | 安卓 | NaN | 0 | 1.05GHz | NaN | NaN | NaN | 1TB | 笔记本 | 高 |
1066兆赫 | NaN | 10英寸 | NaN | 1GB | NaN | IPS | 第一代 | 1000M | 安卓 | NaN | 0 | 1.05GHz | NaN | NaN | NaN | 1TB | 笔记本 | 高 |
1066兆赫 | NaN | 10英寸 | NaN | 1GB | NaN | IPS | 第一代 | 1000M | 安卓 | NaN | 0 | 1.05GHz | NaN | NaN | NaN | 1TB | 笔记本 | 中 |
3200兆赫 | 1 - 2 公斤 | 15.6英寸 | GDDR4 | 2GB | 外接GPU | LED | 第10代 | 1035G1 | Windows 10 家庭版 | 是的 | 0 | 3.6GHz | 1920×1080 | 没有 | 8GB | 512GB | 笔记本 | 低 |
3200兆赫 | 1 - 2 公斤 | 15.6英寸 | GDDR5 | 2GB | 外接GPU | LED | 第10代 | 1035G1 | Windows 10 家庭版 | 没有 | 0 | 3.6GHz | 1920×1080 | 没有 | 12GB | 1TB | 笔记本 | 低 |
有pandas描述功能:
dataset.describe(include = "all")