spark-framework 相关问题


Apache Spark Structured Streaming 中 Spark UI 上的查询和阶段卡住了

我在 EMR 集群 (6.14) 上使用 Apache Spark Structured Streaming (3.1.2)。 Spark 结构化流将数据从 Apache Kafka 流式传输到 Delta Lake 表。当我打开 Spark UI 时,我看到以下内容


Apache Spark 中的 join 和 cogroup 有什么区别

Apache Spark 中的 join 和 cogroup 有什么区别?每种方法的用例是什么?


kedro ipython,如何访问spark会话

我能够在 kedro ipython 会话中加载 Spark 数据集。 首先,我按照此处所述配置了 Spark 会话。 然后我用 ipython --ext kedro.extras.exten 启动了 kedro ipython 会话...


在 Spark 的作业之间移动执行器的开销?

我正在阅读一篇有关 Spark 作业调度的论文,我对他们对 Spark 的概述感到困惑: Spark作业由一个DAG组成,其节点是作业的执行阶段。每个阶段代表...


将 pandas 数据帧转换为 Spark 数据帧时收到错误

由于spark没有开箱即用的支持读取excel文件,所以我首先将excel文件读入pandas数据帧,然后尝试将pandas数据帧转换为spark数据帧,但我得到了...


写入 cassandra 时从 Spark 结构化流数据帧中过滤错误记录

我知道我的 Spark Scala 数据帧的第 n 行存在一些问题(假设数据类型不正确)。当我尝试使用 Spark 结构化流在 cassandra 中写入此数据帧时,它失败了......


如何在Spring Boot 3和Spring Framework 6中注册拦截器

我正在使用 Spring Boot 3.1.0-SNAPSHOT 构建后端,它使用 Spring Framework 6x。 拦截器: @Slf4j 公共类 MyInterceptor 实现 HandlerInterceptor { @覆盖 公众嘘声...


Entity Framework Core 7 连接证书信任异常

我最近在开发中升级到 Entity Framework Core 7,但遇到异常,“已成功与服务器建立连接,但在连接过程中发生错误...


如何在intellij中设置和运行scala-spark?

我正在尝试运行使用 Intellij 来构建用 scala 编写的 Spark 应用程序。当我执行scala程序时,出现以下错误: 线程“main”java.lang 中出现异常。


Glue Dynamic Frame 比普通 Spark 慢得多

在下图中,我们使用三种不同配置运行相同的胶水作业,以了解如何写入 S3: 我们使用动态帧写入S3 我们用纯spark框架写信给S...


将 Spark-Submit 的路径传递到 Python 脚本中

我想将我在 Spark-submit 命令行命令中使用的路径传递到我的 Python 脚本中,以便在写出文件时使用。 (注意:不是当前工作目录,也不是


无法将 Spark 数据帧写入 Mongo

使用 mongo-connector 版本 10.0.1 以下是我的配置 .config("spark.mongodb.write.connection.uri","mongodb://127.0.0.1:27017/") .config("spark.mongodb.write.database&


C# 图像处理:缩放和文件大小约束 (.NET Framework 4.8)

问题 我正在升级旧版软件(.NET Framework 4.8)以与 API 集成,该 API 以 Base64 编码字符串为所有用户提供图片。我能够获取这个字符串,提取它......


Entity Framework Core“未将对象引用设置为对象的实例”,并在 LINQ 中使用嵌套的 .Any

我有一个使用 Entity Framework Core 1.0.0 的 ASP.NET Core 应用程序。 在特定查询中,我收到“对象引用未设置到对象实例”异常。 查询是


通过全局初始化脚本启用 Databricks 集群日志

我想通过全局初始化脚本为工作区中的所有集群(新的或旧的)设置集群日志传送。 我尝试通过自定义 Spark conf 添加底层 Spark 属性 - /databricks/dri...


有没有办法将图像的内容(存储在spark Dataframe中)与pyspark并行写入文件?

我有一个 Spark Dataframe,其中每一行都包含两个项目:文件名(带有扩展名,例如 .jpg)和文件的内容(以字节为单位)。 我想写一个过程...


Spark SQL 不支持 JSONPATH 通配符的任何解决方法

spark.sql("""select get_json_object('{"k":{"value":"abc"}}', '$.*.value') as j""").show() 这会导致 null,而它应该返回 'a...


Entity Framework .NET 8 将数据保存为 JSON 对象

我想像这样在SQL Server中保存数据: 准备 : [ "访问前查看客户数据": "5", “setSmartObjectivesForVisit”:“5”,...


在结构化流 API 中跨多个集群使用共享 Kafka 主题执行 Spark 作业

我正在开发一个 Spark 项目,我需要在两个不同的集群上运行作业,两个集群都使用相同的 Kafka 主题。我希望这些作业能够有效地共享负载并平衡


"message": "方法 Illuminate\Auth\SessionGuard::factory 不存在。",

我正在尝试使用 "tymon/jwt-auth": "^1.0" 将 JWT 添加到 Laravel Framework 7.26.1。已按照文档设置一切。 https://jwt-auth.readthedocs.io/en/develop/quick-start/...


如何在 Cloud Composer 2 的 KerbenetesPodOperator 中指定非默认计算类

我正在 Cloud Composer 2 中使用 KurbenetesPodOperator 创建 pod 来执行 Spark 作业。 默认情况下,当您使用


在 Spark DataFrame python 中将二进制字符串的列转换为 int

所以我有一个数据框,其中有一列,如下所示: +----------+ |some_colum| +----------+ | 10| | 00| | 00| | 10| | 10| | 00| | 10| | 00| | ...


NodeJS 将 Dto 映射到 TypeORM 实体

我有一个运行nestjs框架的nodejs REST API后端,使用typeORM作为我的实体的ORM。 来自 C#/Entity Framework 背景,我非常习惯将 Dtos 映射到数据...


为什么 EFCore 6 不再在 iOS 上运行?

我在使用 .net6 构建的 iOS 应用程序上使用 Entity Framework Core 6。它曾经适用于旧版本(EF 和 .net),但现在我收到以下错误: 系统。


从spark/scala项目代码中资源文件夹中的sql文件读取查询

我在 IntelliJ 中的文件夹结构如下 src-->主-->资源-->sql-->samplequery.sql 我在文件夹 src--> main-->scala-... 中有 scala 对象文件samplequeryexecute


pyspark 检查点在本地计算机上失败

我刚刚开始在本地计算机上使用独立版本学习 pyspark。我无法让检查站工作。我把剧本归结为这个...... Spark = SparkSession.builder.appName("PyTest").master("


Entity Framework Core 7 外键

我的实体中有一个外键“string ParamName”,它指的是ParamDesc实体。我怎样才能使这个外键不严格?我的意思是,我希望我的外键可以包含任何值,甚至......


Databricks Spark:java.lang.OutOfMemoryError:GC 开销超出限制 i

我正在 Databricks 集群中执行 Spark 作业。我通过 Azure 数据工厂管道触发作业,它以 15 分钟的间隔执行,因此在成功执行三到四次之后...


Entity Framework 6.1 - 使用 INCLUDE 语句创建索引

既然索引在实体框架 6.1 的最新测试版本中可用,是否有可能在代码优先方法中创建与此 SQL 语句相同的索引? 创建非簇...


如何使用诗歌从 test.pypi.org 安装软件包?

我想在我的项目中使用包的预发布版本(https://test.pypi.org/project/delta-spark/2.1.0rc1/)。 我正在使用诗歌来管理我的 pyproject.toml。我该怎么做呢? 换句话说...


我在安装 pyspark 时遇到错误,如何修复它?

我想安装并练习pyspark。但是在安装和进入 pyspark-shell 过程中,出现以下错误。 C:\Windows\System32>spark-shell 将默认日志级别设置为“WARN”。 至


JUNIT 测试用例-Spark JDBC

我是 Java 编程的新手。我有一个从Oracle数据库读取数据的方法。现在我需要帮助使用 JUnit 框架为以下代码编写测试用例。 数据集 df = Spark.read().


.NET 6 连接到 Windows 会话切换

我正在将一个应用程序从 .NET Framework 迁移到 .NET 6。它在内部启动 Kestrel Web 服务器,并且旨在作为 Windows 服务运行 - 在使用 Topshelf li 实现的旧版本中...


使用 EF Core 和 GraphQL 在 ASP.NET Core 中保留唯一的连续组编号

我正在使用 ASP.NET Core Minimal API (.NET 7) 和 Entity Framework Core、HotChocolate(用于 GraphQL)和 Microsoft SQL Server 数据库开发 API 后端。我遇到了一个特定的挑战...


使用 Entity Framework Core 6 对表的子集应用逆向工程

我正在开发 ASP.NET Core Web API (.NET 6),我想仅对某些表应用逆向工程。因为数据库相当广泛,我不需要所有的表,只需要一些


不支持关键字:“服务器”。旧的Asp.Net系统

我有一个使用 .Net Framework 4.0、ASP.Net、EntityFramework、C# 和 SQL Server 2014 的旧系统。 我在尝试运行系统时不断收到错误消息,它以前可以工作! - “服务器错误...


无法使用Robot Framework的“输入文本”关键字输入卡号

我是机器人框架的新手。 在卡号文本字段中输入卡号时,仅输入前 4 位数字。要输入其余数字,我必须使用“输入...


在 XCFramework 中难以访问 Swift Framework 中的 Objective-C 类

我有一个 Swift 框架,我想添加一个 Objective C 包装器以从 Objective C 项目进行访问(出于某种原因,这是要求)。 我已经封装了 Swift 类以支持 Objec...


将 Fastq 文件直接读取到 Pandas Dataframe 中

我正在尝试将 Fastq 文件直接读入 pandas 数据帧,类似于下面的链接: 将 FASTQ 文件读入 Spark 数据帧 我到处搜索,但找不到可行的选择。 电流...


ASP.Net Core 容器在自定义端口 8080 上运行,但 ASP.Net 容器在 Docker Windows 中在固定端口 80 上运行

我根据以下图片制作了两个容器: ASP.NET核心 mcr.microsoft.com/dotnet/aspnet:8.0.0-windowsservercore-ltsc2019 网络应用程序 来自 mcr.microsoft.com/dotnet/framework/aspnet:4.8-windowsserv...


为什么这个API请求不能正常工作

我使用 Django-REST Framework 开发了一个 API,并尝试将其与我的前端连接。 我有一个终点来获得最后四名获胜者,当我尝试时它工作正常 异步函数


由于 URL 构造不正确(404 Not Found),React 组件未显示获取的数据

我正在开发一个 React 组件,以使用 Axios 从 Django REST Framework API 获取数据。但是,该组件没有显示获取的数据,并且我遇到了 404 Not Found 错误...


导出到 .framework 的 Kotlin 多平台库在 Xcode 上崩溃

我正在尝试使用 Kotlin Multiplatform 实现一个库以在我的 iOS 项目中使用,因此我下载了官方库模板,它实现了斐波那契数列。 我只做了 2 处更改


火花计数未给出正确结果

我是 Spark 的新手,最近了解到它会在调用某个操作时执行所有转换。在搜索过程中,我找到了一个简单的代码来测试它,结果并不符合预期。 他...


如何在 PySpark 中按条件聚合相邻行进行分组

我在 Spark 数据框中进行条件分组时遇到问题 下面是完整的例子 我有一个数据框,已按用户和时间排序 活动地点用户 0 观看


不支持关键字:“服务器”。旧的 ASP.NET Web 表单系统

我有一个使用 .NET 4.0、ASP.NET、Entity Framework、C# 和 SQL Server 2014 的旧系统。 我在尝试运行系统时不断收到此错误,它以前可以工作! “/”应用程序中的服务器错误...


在 .NET Framework 应用程序中使用 TableAdapter 更新数据失败

在 Visual studio 2022 中,我创建了一个 VB 表单,与 SQL 中的表连接。 我可以在表中添加新记录但不能更新。这是代码 Private Sub ButtonUpdate_Click(发送者作为对象,e作为


如何在 AWS EMR 上配置/安装 JDBC SQLServerDriver for Spark 3.5?

我正在开发一个 PySpark ETL 管道应用程序,以便最终部署在 AWS EMR 上。数据从 Microsoft SQL Server 数据库中提取或提取。当我在本地运行代码时,我使用本地 mas...


Spark JDBC 写入 Teradata - 如何编写并行查询

我有一个大约 2000 万行和 5 列的数据帧,我想将其写入 Teradata。我面临的问题是它需要一个绝对年龄来加载,因为我们可以使用一个分区,因为表将......


Entity Framework Core:如果我们永远不会恢复迁移,删除 Migration.Designer.cs 是否安全?

我们有一个包含约 200 个表的数据库架构。 为每次迁移创建的模型快照 (Migration.Designer.cs) 约为 20K 行。因此,进行大量迁移确实会减慢我们的速度...


© www.soinside.com 2019 - 2024. All rights reserved.