Amazon预览图像生成模型、新增文字生成模型

AWS

Amazon周四在re: Invent大会上公布AWS生成式AI模型产品，包括第一个图像生成式模型Titan Image Generator，以及文字生成模型Amazon Titan Text Express及Titan Text Lite。

新公布的模型中，Titan Image Generator为Amazon自行开发的Titan家族最新模型之一，使其得以赶上OpenAI、Google、微软等竞争者，具备图片编辑及加入浮水印等功能。Titan Text Express及Titan Text Lite则是AI模型平台Bedrock的新增文字模型。在Bedrock服务平台上，用户可以透过Bedrock控制台直接存取使用，或是以自有资料再加以客制化训练。

Amazon Titan Image Generator允许用户以英文自然语言输入提示视窗，以建立专业等级的图像，作为广告、电商平台，或是媒体与娱乐内容。Amazon表示，这项服务是以高品质而多元化的资料训练而成，可生成精准、贴近真实、少扭曲，且属性多元的图片，并能理解包含多个物件的复杂提示。

Titan Image Generator的图片编辑功能之一，是利用内建分割模型自动编辑图片。最新模型支援以图片遮罩进行修补（inpainting）及以扩展（outpainting）延伸或变更图片背景。使用者可设定图片大小、指明想要模型产生几种款式。用户也可利用其自有资料客制化模型，以生成和公司品牌指引一致的图片，或是透过微调令模型生成特定风格的图像。它也支援负责任AI原则，防止生成有害或恶意的图片。

此外，有鉴於这模型可被用於生成Deepfake影像，所有以Titan生成的图片都会加入看不见的浮水印，以利辨识AI生成的图片。不过Amazon并未说明技术资讯。《The Verge》引述AWS主管指出，这浮水印不会破坏图片画质，也无法被裁切或压缩掉，但使用者需要连结到独立API以判别是否为AI生成。

AWS还为Bedrock新增了2个Titan文字生成模型Titan Text Express及Text Lite。Titan Text Express为「价格和效能兼顾」的文字生成模型，提供最多8000 token输入，也可以微调。它支援的情境包含检索增加生成（retrieval-augmented generation）、开放式文本生成、脑力激荡、摘录重点、程式码及表格生成、文本改写、改述（paraphrasing）、关联思考（chain of thought）、撷取、问答及聊天等。

而Text Lite版则是为特定使用场景而设计，强调「具成本效益且可高度客制化」的LLM。Lite版最大输入为4000 token，支援场景包括摘录重点及文案写作（copywriting）。

Titan Text Express目前已正式推出英文版，并有100多个语言版本已以预览版上线，Titan Lite则仅支援英文。

除了主打的图片生成模型外，AWS昨日还推出Titan多模嵌入（Titan Multimodal Embedding）模型。此一模型可支援多模态提示输入，包括文字、图片或者两者同时输入。Titan多模嵌入模型支援输入最高128 token及25MB图片，仅支援英文。

Titan多模嵌入提供非同步批次API，Amazon OpenSearch Service的神经搜寻（Neural Search）很快也会加入连接器，以便加入Titan多模嵌入模型支援。

Tags: 大数据

Amazon预览图像生成模型、新增文字生成模型

【R18 黄游评测】天下布魔，征服世界组织专属自己的後宫军团！

玩喵剧情向🔞新作《眼眸之城与梦境少女》无照密医深夜密会病弱少女

绅士无人岛性活《荒岛X爱X求生》将登Steam，多结局後宫+「夫目前犯」曹开心

动画疯 VPN 推荐清单！实测过确定可行，让你在国外也能看，2023 最新

丹麦科学家探索以 LOVOT 机器人协助照顾失智症患者

Howie Su／让「虚拟分身」替你工作！90间新创联手引爆元宇宙想像

特斯拉 AI Day 2022：自驾车与机器人的大脑解密

会跳舞、翻身，小米机器狗「铁蛋」动眼看

微软宣布 Windows 10 将停止支援 Office

微软重申坚持 TPM 2.0 门槛　Windows 11 硬体需求不妥协

Google NotebookLM 引入新功能并将推商业版本

彭博：新 AirPods Max、AirPods 4 随 iPhone 16 发布会登场

Welcome Back!

Retrieve your password