large-files 相关问题

即使对于有经验的程序员来说,大文件(无论是二进制文件还是文本文件)有时也会出现问如果出现与在文本编辑器中打开和/或写入大文件,管理运行到千兆字节的资源或大量数据的战略决策相关的问题,则应使用此标记。

如何通过pandas过滤巨大的csv文件

我有一个巨大的csv文件,大小为10GB数据/历史记录_{待搜索的日期}.csv,该文件有超过27000个邮政编码。根据邮政编码,我必须过滤 csv 文件,然后每个过滤后的文件我...

回答 1 投票 0

从 git 存储库/历史记录中删除文件夹

我不小心将大文件夹提交/推送到了 github,并且无法进一步推送。当尝试提交和推送时,我收到以下消息。 “批量响应:此存储库已结束

回答 1 投票 0

使用 Microsoft Graph SDK 上传大文件失败,并出现错误 System.ArgumentOutOfRangeException

我正在尝试使用 Microsoft Graph SDK 上传 2GB 文件。 第一个请求 UploadAsync() 失败,并出现错误 System.ArgumentOutOfRangeException:'需要非负数。 (参数'偏移')'

回答 1 投票 0

如何使用typo3 extbase控制器操作下载(大)文件

我有一个在 TYPO3 中具有下载操作的控制器。一段时间以来,我已经像这样实现它并且它正在工作: 函数下载动作() { // ... // 发送标头... // ... 如果 ($fh =...

回答 2 投票 0

Python:切片非常大的二进制文件

假设我有一个 12GB 的二进制文件,我想从其中切出 8GB。我知道我想要在之间切换的位置索引。 我该怎么做呢?显然 12GB 无法放入内存,那是......

回答 1 投票 0

如何在 Visual Studio 中打开大于可用内存的文件?

在使用 Windows 之前,我记得使用十六进制编辑器,该编辑器仅加载我正在处理的文件部分。我需要将一个大于可用内存的文件加载到 Visual Studio 中进行搜索...

回答 1 投票 0

在 NodeJS 中编辑大型(1.5gb)文本文件的最后部分

我的工具将末尾带有逗号的小 json 块附加到一个 txt 文件中,该文件最初以 [ 作为第一个字符,以便创建一个完整的 JSON 格式文本文件,如下所示, {数据:text1},...

回答 1 投票 0

使用 Pandas 对大文件进行切片、删除重复项并合并到输出中

所以,我有一个包含 12.5 亿个特征的地理包。该文件实际上并不包含几何图形,只有一个属性“id”,即唯一的 id。有很多重复的内容,我想删除

回答 2 投票 0

c# 分成两幅图像/流转位图

我使用Visual Studio 2022 C#语言。 (新手...)。我想将一张图像分成两部分(分成两半)。分割图像中的第一张图像输入到第一个 picutrebox,然后输入另一个第二个图像...

回答 1 投票 0

ProcessPoolExecutor 可以与 Python 中的产量生成器一起使用吗?

我有一个python脚本,旨在处理一些大文件并将结果写入新的txt文件中。我将其简化为代码示例 1。 代码示例1: 从并发.futures 导入 ProcessPoolExec...

回答 1 投票 0

如何在 JupyterLab 中禁用大尺寸警告?

JupyterLab 中的大尺寸警告示例: 我不想禁用所有警告,而只想禁用大尺寸警告。

回答 1 投票 0

在flask中上传大型csv文件

我正在使用 Flask 为一个大(200 MB)csv 文件编写一个上传页面。这个简单代码的本地运行仍然不会超出 request.files 行: 并且运行会卡在这个级别,ho...

回答 1 投票 0

如何在更短的时间内将大型 csv 文件(~1TB)转换为极坐标数据帧?

我有一个非常大的 CSV 文件,大小为 1TB。我想转换为极坐标数据帧,但生成数据帧需要 > ~15 分钟。 我怎样才能更有效地做到这一点?有很大机会...

回答 2 投票 0

如何在非常大的 CSV 文件(超过 400 万条记录)上运行 SQL 代码,而无需打开它

我有一个包含超过 400 万条记录的非常大的文件,我想对其运行 SQL 查询。但是,当我打开该文件时,它只会返回 100 万个联系人,而不会加载其余的。我有办法吗...

回答 1 投票 0

Spring webflux流动态构造大zip文件

我想使用 spring webflux 创建一个端点,在其中创建一个包含多个文件的 zip 文件。我也根据一些数据库查询动态创建这些文件。由于此 zip 文件可以是双...

回答 1 投票 0

仅将 sed 应用于循环中最后一次匹配之后的文件部分 - shell / bash

所以我有几个这样结构的大文件(~1Gb): fooA iug9wa 福阿·劳伊 fooA nwgoieb 福布·威尔格布 fooB rqgebepu fooB ifbqeiu ... fooN ibfiygb 傻瓜yvsiy 福纳埃维乌 我想更换

回答 1 投票 0

VisFileCopy 不适用于大文件

我在 Centura 3.0 团队开发人员工作,我想复制大文件 VisFileCopy 不适用于大文件。 不幸的是,我无法找到与最大允许深度相关的任何文档...

回答 1 投票 0

使用与openssl命令行兼容的AES-256-CTR为大文件openssl加密创建php代码

我正在尝试创建一个 PHP 方法来复制 OpenSSL 命令行函数,以便我可以使用 PHP 加密,然后使用命令行解密。 我创建了 PHP 方法来加密文件...

回答 1 投票 0

如何使用 python 使用多流解析 .xml.bz2 格式的大型维基百科转储,这样我就不必打开整个文件?

这里是有关维基百科转储以及如何使用多流的文章的链接,这样我就不必打开整个文件来解析它。这是它建议使用的库。 ...

回答 2 投票 0

lxml iterparse 会占用 4GB XML 文件的内存,即使使用了clear() 也是如此

该脚本的目的是提取每年出版的文章/书籍的数量,并从 xml 文件 dblp-2023-10-01.xml 中的元素获取此信息。该文件可以找到...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.