11 月 4 日消息,OpenAI 推出了公开测试版的 API,使其图像生成软件 DALL-E 更广泛地提供给企业。该 API 将使企业更容易将 DALL-E 的文本转图像功能添加到他们的产品中,为开发者提供简化的工具,以便按照他们的喜好整合和定制该软件。
该 API 的一个早期使用案例是微软的 Designer 应用程序,该应用使用 DALL-E 为 Office 用户生成图像。微软是 OpenAI 的主要投资者之一,并在上个月发布了该应用程序。
OpenAI 负责 API 的产品经理 Luke Miller 称:“我们已经有一些客户以非常有趣的方式在此基础上进行开发。有些是创造性的探索,有些是更多的商业导向。一家名为 Mixtiles 的初创公司正在使用该 API 生成用于家庭装饰的海报和艺术品,另一家名为 CALA 的公司正在使用它来帮助客户设计他们自己的服装。”
在过去的一年里,人们对文本转图像人工智能的兴趣和采用呈爆炸式增长,而 OpenAI 虽然曾经是该领域的领导者,但现在受到了 Midjourney 和 Stability AI 等后来者的挑战,并且他们对用户的限制较少,允许用户在几乎没有监督的情况下建立自己的 AI 系统。同时,这一领域的其它参与者,如谷歌和 Meta,采取了更为谨慎的方法:开发具有类似能力的系统,但将其公开使用限制在非常有限的场景中。
文本转图像人工智虽然能提供的明显的创造性好处,但也存在多方面的问题。该软件可以被用来产生错误的信息和有害的图像,并且在数据使用方面存在着具有挑战性的道德问题。
像 DALL-E 这样的文本-图像人工智能系统是根据从网络上搜罗的图像进行训练的,这些图像通常包括摄影师、艺术家和设计师的版权作品。许多艺术家感到愤怒的是,由此产生的技术不仅可以用来模仿他们的个人风格,而且他们也没有因为使用他们的作品为 OpenAI 这样价值数十亿美元的公司创造收入而得到补偿。
一些开发文字转图像应用的公司开始提供补偿。例如 Shutterstock,他们将其贡献者的数据授权给 OpenAI 以创建 DALL-E,并使用其 API 生成定制的库存图像,最近该公司宣布正在设立一个贡献者基金,以补偿其作品被用于训练 AI 的个人。
当被问及 OpenAI 是否计划制定任何类似的计划来补偿艺术家时,Miller 说现在没有任何具体的东西可以分享,会继续从社区寻求反馈,并称这是一个非常复杂的问题,需要从很多不同的角度来考虑。
对于 OpenAI 来说,这个问题确实难以回答,因为该公司从未分享过用于创建 DALL-E 的训练数据。法律专家称,在美国,通过刮取公共图片,即使是受版权保护的图片,来训练人工智能模型可能会被合理使用原则所涵盖。但许多艺术家指出,充分的法律保障并不等于道德上的认可。
OpenAI 说,对 DALL-E API 的访问开始时将是有速率限制的,不会在客户如何使用该技术方面进行审查。客户将按生成的图像数量收费,并能在三个分辨率级别中进行选择:256 x 256 的图像每张 0.016 美元(约 0.1168 元人民币);512 x 512 的图像每张 0.018 美元(约 0.1314 元人民币);而 1024 x 1024 的图像每张 0.02 美元(约 0.146 元人民币)。