埃隆·马斯克旗下的人工智能公司xAI 近期在其API服务中正式加入了图像生成功能,标志着公司在多模态AI领域迈出了重要一步。 这一新功能由名为“grok-2-image-1212”的模型驱动,允许开发者和用户通过简单的文本描述,快速生成图像内容。
用户可以通过提交文本提示词,一次性生成最多10张JPG格式的图像。目前,每次API请求的定价为0.07美元,换算成人民币约为0.51元。 这一价格定位在市场上属于中等水平,考虑到图像生成服务的成本,以及xAI在技术实力上的投入,这样的定价策略也相对合理。

事实上,这并不是xAI首次涉足图像生成领域。 早在去年,xAI就曾与AI创新企业Black Forest Labs合作,在马斯克的社交平台X(原Twitter)上推出过类似的服务。 当时的收费标准略低于当前API,约为0.05美元。 此次推出的API服务,可以看作是对之前尝试的升级和商业化拓展。
根据xAI官方文档显示,当前版本的API在自定义选项方面存在一定的局限性。 用户暂时无法直接控制图像的质量、尺寸或风格。 值得注意的是,用户提交的提示信息可能会经过“聊天模型”的预处理,以优化生成图像的效果。 这种预处理机制可能旨在提升图像生成的精度和相关性,但也侧面反映了当前模型在理解复杂或细致描述方面的能力仍有提升空间。 从技术的角度来看,缺乏更精细的控制选项, 可能意味着xAI在算法层面更注重稳定性和易用性,而非完全开放的自由定制。
除了扩展其API功能,xAI还在积极进行战略布局。 近期,该公司收购了一家专注于生成式AI视频的公司,这一举措预示着xAI未来的业务发展方向或将包含视频生成领域。 同时,xAI还计划扩建其位于孟菲斯的数据中心,旨在提升其模型的训练和运行能力。 扩建数据中心是发展AI的必要步骤。 可以预见,随着数据中心规模的扩大,xAI的模型在性能和效率上都将得到显著提升。 这一系列举措表明了xAI在人工智能领域的长期投资和发展雄心,以及成为行业领军者的愿景。