dataset 相关问题

数据集是数据的集合,通常以表格形式表示,其中列表示不同的变量,行表示集合的不同成员。如果您正在寻找可用于任何目的的免费数据集,请考虑在https://opendata.stackexchange.com上提出您的问题。

如何过滤数据表?

我使用包含有关用户信息的数据表,我想在此数据表中搜索用户或用户列表。我尝试了一下,但不起作用:( 这是我的 C# 代码: 公共数据表 GetEntriesBySearch(

回答 7 投票 0

属性错误:无法在 <module '__main__' (built-in)>

我有一个已经预处理过的数据集,但这个错误仍然出现。 我已经尝试过几个社区的 if__name___=='main_': 方法,但是如果我使用不正确,我就会不断收到错误...

回答 2 投票 0

Python - Tensorflow:如何将函数正确映射到数据集

我正在学习机器学习课程,但在使用给定代码解决问题时遇到一些困难。 将张量流导入为 tf 将tensorflow_datasets导入为tfds (数据),信息= tfds.load(...

回答 1 投票 0

CMU-MOSI 数据集 - 需要解释

我正在尝试理解对齐的 CMU-MOSI 数据集维度 对于文本来说或多或少是清楚的 - 对于对齐版本(50),他们只是将 BERT 分词器最大长度设置为 50,因此数据的形状是: 数据['tr...

回答 1 投票 0

读取文本列的大型数据文件的最快方法是什么?

我有一个近 900 万行的数据文件(很快将超过 5 亿行),我正在寻找最快的方式读取它。五个对齐的列被填充并用空格分隔,.. .

回答 6 投票 0

AttributeError:“DatetimeIndex”对象没有属性“weekday_name”

我的代码: dfs['dayofweek'] = dfs['date'].apply(lambda x: x.weekday_name) dfs['dayofweek'] = pd.Categorical(dfs['dayofweek'],categories=['星期一','星期二','星期三', ‘周四’、‘周五’、’

回答 2 投票 0

需要更改r中数据集的值

我有一个名为 Michelson 的小标题,其中包含一个名为 Expt_2 的列,其值以 MPH 为单位测量。我正在尝试将此列中的所有值转换为每秒公里数。 我尝试转换

回答 1 投票 0

tensorflow.data.Dataset.from_generator() 将字符串参数转换为字节

我有一个自定义生成器,它采用字符串格式的两个日期作为参数,并从日期范围内生成(特征、标签)。我想用它创建一个数据集,但是 tf.data.Dataset。

回答 1 投票 0

在 R 中转换数据集

我尝试使用 R 如下转换我的数据。我尝试了 tidyverse 但没有运气进入单个列。我有这样的情况,例如 Col2 对于 col1 最多有 50 条记录。

回答 1 投票 0

将多个 .xml 文件导入到数据集中

所以,这就是我想做的: 我想将文件夹(比如 C:\Bla\AllMyLittleXmlFiles)中的所有 xml 文件导入到 DataSet 中,对其进行操作,然后从那里将其导出到 SQL Server。是这样吗

回答 6 投票 0

如何使用 Huggingface 从字符串列表中创建数据集,以使用 Transformer 库微调 Llama 2?

我有一个字符串列表,我想用它们来微调 Llama 2。列表中的每个条目都包含几个句子。 我需要将其转换为正确的格式才能使用

回答 1 投票 0

将空格分隔的数据集加载到 R 中,而不删除字符串之间的空格

我有一个大的 csv 文件,其中一行的所有值都在一个单元格中,并用空格分隔。该数据是数值和字符串的混合。当我加载数据时,它会将字符串拆分为

回答 1 投票 0

使用 Iris 数据集在 Python 上进行模糊聚类

我正在研究虹膜数据集的模糊c均值聚类,但是由于一些错误而无法可视化。使用本教程我为虹膜编写了以下内容,但是它显示了名为“

回答 1 投票 0

我想使用 .weekday() 创建一个新的分组数据框,其中仅包含带假期的日期

所以我有一个数据框: 日期代表日月年病例死亡人数国家/地区名称土地.面积..平方公里..公里。 0 2021-09-21 21 9 2021 1162 7 奥地利 82520.0 1 2021-09-20 20 9 2021 170...

回答 2 投票 0

在 Google Colab 中导入猫狗数据集时出错

尝试使用 tfds 模块下载“Cats_vs_Dogs”TensorFlow 数据集时,出现以下错误 👇 下载错误追踪(最近一次调用...

回答 5 投票 0

SSRS - 使用不同数据集字段的表达式

我有一份包含多个数据集的报告。不同数据集中的不同字段用于报告的不同位置。 在报告的一部分中,我需要使用字段进行计算...

回答 3 投票 0

源不包含数据行

DataTable dt = ds.Tables[4].AsEnumerable() .Where(x => ((DateTime)x["EndDate"]).Date >= DateTime.Now.Date) .CopyToDataTable(); ds.Tables[4] 有行但抛出异常 “……

回答 2 投票 0

Pandas DataFrame:过滤掉“平线”(值,n 行不会改变)

我想过滤掉至少n行值相等的数据点。 具体来说,检测至少n行的相等值,并过滤掉所有连续的相等数据。 这里有考试...

回答 1 投票 0

如何有效构建适合llm(大语言模型)预训练的数据集?

我想从头开始预训练我自己的LLM,所以首先我尝试构建数据集。 经过多次网络搜索和研究,我从huggingface的公开课程中得到了一些想法: 来自变形金刚...

回答 1 投票 0

lists = list(zip(*reader)) 在 python 中做什么

导入csv 以 open('cleaned_all_phones.csv') 作为文件: 读者 = csv.reader(文件) 列表 = 列表(zip(*读者)) 对于列表中的行: #打印y轴 打印(行[0]) #

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.