如何保护开源免遭人工智能(误)使用?

问题描述 投票:0回答:3

截至 2023 年,有大量(生成式)人工智能可供公众使用;通常,他们会为给定的上下文重新构建最可能的符号序列。

对于无数学校的文本分析来说,这可能没问题,但在我看来,它们生成的代码处于危险边缘。我跳过阐述这方面并直接回答我的问题:

当我将源代码发布为开源时,我可以选择在哪个许可证下发布它。 (任何类型的艺术都是如此。)

如果我希望人类能够使用我的资源,但不能使用当前一代的人工智能,我该怎么办?哪些标记、许可证等有效?

对于网络爬虫,有robots.txt;什么可以用来防止当前的人工智能窃取和盗用某人的工作(甚至没有归属)?

web-crawler artificial-intelligence open-source
3个回答
3
投票

实际上,您无法有效地保护您的代码(或其他任何内容)免遭人工智能系统的使用和消耗。 (这是简短而悲观的答案。)

我还是想试一试:


技术方面:

大多数人工智能系统通过抓取互联网、解析现有库(例如语言文件、源代码存储库、数据集等)、数据库等来获取数据。当然,如果你是谷歌或微软并且拥有位于地下室的具有完整互联网缓存的搜索引擎。

据我所知,没有特定的标记或类似的标记(正如您提到的与 robots.txt 或其他类似的标记),它告诉人工智能后退并离开场所。这是一个好主意,可能会在未来几年内获得关注。然而,它需要一种标准化的方式来将这些元数据与许多不同类型的数据一起存储在许多不同的平台和环境上。

目前,我想限制使用的唯一方法是将您的代码(或其他信息/文本/数据)锁定在具有“仅限成员”访问权限的封闭存储库中。仔细阅读 Github 和其他服务的许可条款可能会很有趣。 ——仅仅因为某些内容被关闭并不一定意味着所有者不会将这些内容用于人工智能目的。 (Github可能没问题,但我没查过,所以我真的不知道。)

您也许可以找到一些很好的服务,它们特别意识到这些问题。这可能是我最好的建议。


在法律方面(已经提到):

即使您选择了特定许可证并添加了附录,规定了对 AI 使用的特定限制,这也不能保证任何事情。

当然,人工智能系统所有者可能会在违反您的许可条款时做错事,但您需要证明您的情况。在国际化的世界中,这变得更加困难。


总结:

你需要将这两个维度结合起来,这样你就有了一个技术维度,可以防止人工智能系统拾取你的东西,并以适当的许可证形式添加一个法律维度,你可以从你的帽子里拿出来万一灾难来袭。

只是我的两分钱。希望这能为您提供一些解决问题的想法。

干杯! :-)


0
投票

到目前为止,还没有专门的许可证来阻止人工智能使用代码。如果您想限制人工智能的使用,您可以创建自定义许可证。但制作新许可证需要法律专业知识才能有效。自定义许可证可能不像 MIT、GPL 或 Apache 许可证那样广为人知,开发人员更喜欢这些许可证以实现兼容性。在决定针对 AI 限制的自定义许可证时,请考虑您的意图和实用性之间的平衡。


0
投票

在任何系统中,使用人工智能都很难保护您的开源数据免受错误信息的影响。设置防火墙可能会限制错误信息。但就像任何技术系统一样,总有办法绕过它。然而,人工智能为你提供了一个通用模板。例如,在医疗保健系统中,它可能是患者的病历、年龄、体重、身高和体重指数。 希望这些信息有帮助!

© www.soinside.com 2019 - 2024. All rights reserved.