dataset 相关问题

数据集是数据的集合,通常以表格形式表示,其中列表示不同的变量,行表示集合的不同成员。如果您正在寻找可用于任何目的的免费数据集,请考虑在https://opendata.stackexchange.com上提出您的问题。

生成具有精确平均值和标准差的样本数据

我想创建一个具有特定平均值和标准偏差的数据集。 使用 np.random.normal() 给我一个近似值。然而,对于我想要测试的内容,我需要精确的平均值和标准偏差。 我...

回答 4 投票 0

获取不同行数的python和spark scala - dataframe

我正在尝试删除数据框中某些列的空值,但我得到的行数不同,python 和 scala 都不同。 我对两者都做了同样的事情。在 python 中,我收到 2127178 行,而 scala 我收到...

回答 1 投票 0

将 tf.data.Dataset 转换为 tfds.data_source

我目前有一个已使用加载的数据集 (ds_train, ds_test, ds_val), ds_info = tfds.load('speech_commands', split=splits, data_dir=Flags.data_dir, with_info=True) 已被映射...

回答 1 投票 0

Chart.js 线,负点不同的填充颜色

当点为负数时,我需要更改 Line Chart.js 中的填充颜色(内部区域)。 代码简单且基本: $(文档).ready(函数(){ var ctx = $("#myChart").get(0).getCon...

回答 7 投票 0

使用 Huggingface 数据集,如何将特定特征设置为 numpy 数组,以便加载回来时它们是 ndarray?

当使用 load_dataset() 加载 Mozilla Common Voice (v11) 数据集时,生成的数据集 (ds) 具有作为 numpy 数组的 audio.arrays。我不知道如何重现这个。 你如何只设定一项壮举...

回答 1 投票 0

通过(包装的)编码器将数据集转换为案例类

这是我的数据集: val bfDS = session.select("bf") session.select("bf").printSchema |-- bf:数组(可空 = true) | |-- 元素:结构(containsNull = true) | | ...

回答 1 投票 0

在哪里可以找到一组带有真实标签的良好基准聚类数据集?

我正在寻找一个具有“真实值”标签的聚类数据集,用于一些已知的自然聚类,最好具有高维度。 我在这里找到了一些不错的候选人(http://cs.joensuu.fi/sipu/

回答 2 投票 0

有没有一种方法可以让我只从huggingface下载部分数据集?

我正在尝试加载(人民语音)数据集,但它太大了,有没有办法只下载其中的一部分? 从数据集导入load_dataset 从数据集导入load_dataset 火车=

回答 1 投票 0

如何在 2 个独立的数据集上划分数据帧,其中 70%/30% 的唯一 id 为 Python Pandas 中的每个 id 获取所有行?

我在Python Pandas中有数据框,如下所示: 输入数据: df = pd.DataFrame({ ‘id’: [999, 999, 999, 185, 185, 185, 44, 44, 44], “目标”: [1, 1, 1, 0, 0, 0, 1, 1, 1], 'event_date':[...

回答 1 投票 0

从带有多个对象的 pandas 中的 JSON 文件读取数据

我正在使用 ACN Data 中的 JSON 文件进行 EV 充电行为。我想用 python 读取它并将其转换为 pandas 数据框。问题是 JSON 有多个对象,我面临着一些

回答 1 投票 0

如何在 R 中将列转置为行并确保相应的行重复?

如何调换列并确保行相应重复? 数据集 df 具有以下数据:- 日期 年月日 美元 欧元 日元 1994-1-1 1994 1 1 10 20 5 1995-...

回答 1 投票 0

使用存储过程将两个数据源合并为 SSRS 报告中的一个数据源

我正在尝试构建 SSRS 报告,该报告将从两个不同的服务器获取数据。 我已经创建了一个存储过程,该过程在 Management Studio 中运行时工作正常,但存储过程相同

回答 1 投票 0

衡量独立性

我想确定我所使用的数据集的假设是否是独立同分布的。实际上是有效的(对于任意数据集,可能由图像组成)。有没有什么半正派的独立措施...

回答 1 投票 0

根据xarray.Dataset中的时间索引打印出特定变量

我使用 nc = xarray.open_dataset(...) 访问了 netCDF 文件。数据集包含以下内容: 维度:(纬度:121,经度:261,时间:8760) 坐标: *

回答 1 投票 0

尝试分析 SAS 中包含许多家庭的队列数据集,如何编码以查看家庭内部情况?

我对 SAS 还很陌生,正在尝试整理数据集。在数据集中,如果其中一个家庭被确诊患有呼吸道疾病,就会被招募。每个成员都有自己的参与...

回答 1 投票 0

有没有一种有效的方法从 h5py 中的 3D 数据集加载 2D?

我是一名研究生,研究 MR 到 CT 的翻译。 我在 h5py 中创建了 MR、CT 和 MASK 组,并在每组中以数据集的形式保存每个患者的 3D 数据。 当**加载数据**

回答 1 投票 0

为定制数据集准备音频数据

我想创建一个定制的音频数据集。首先,我需要准备音频数据,以便其组织良好。为了测试和调试我的代码,我使用了一个包含 6 个 WAV 文件的文件夹,cal...

回答 1 投票 0

Ado.NET 用于 Web 开发的“断开连接架构”

我是asp.net 和ado.net 的新手。我必须使用 .net 开发一个内容管理系统,我想知道哪个选项适合我,是断开连接还是连接网络架构? 我不明白...

回答 1 投票 0

使用 Colab 进行 Streamlit

我正在使用 Streamlit 和 Colab。该单元持续运行,但其共享的链路不起作用。有什么解决办法吗? 我没有收到任何错误。只是链接不起作用。两者...

回答 1 投票 0

生成在 C 语言中具有可重现结果的半 RNG(非随机/随机)

我希望创建一种“随机性”,或者至少在给定某些数据集的情况下创建大量的熵。不过,根据各种因素,结果必须是可预测/恒定的,数据集是什么

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.