AWS
Amazon周四在re: Invent大会上公布AWS生成式AI模型产品,包括第一个图像生成式模型Titan Image Generator,以及文字生成模型Amazon Titan Text Express及Titan Text Lite。
新公布的模型中,Titan Image Generator为Amazon自行开发的Titan家族最新模型之一,使其得以赶上OpenAI、Google、微软等竞争者,具备图片编辑及加入浮水印等功能。Titan Text Express及Titan Text Lite则是AI模型平台Bedrock的新增文字模型。在Bedrock服务平台上,用户可以透过Bedrock控制台直接存取使用,或是以自有资料再加以客制化训练。
Amazon Titan Image Generator允许用户以英文自然语言输入提示视窗,以建立专业等级的图像,作为广告、电商平台,或是媒体与娱乐内容。Amazon表示,这项服务是以高品质而多元化的资料训练而成,可生成精准、贴近真实、少扭曲,且属性多元的图片,并能理解包含多个物件的复杂提示。
Titan Image Generator的图片编辑功能之一,是利用内建分割模型自动编辑图片。最新模型支援以图片遮罩进行修补(inpainting)及以扩展(outpainting)延伸或变更图片背景。使用者可设定图片大小、指明想要模型产生几种款式。用户也可利用其自有资料客制化模型,以生成和公司品牌指引一致的图片,或是透过微调令模型生成特定风格的图像。它也支援负责任AI原则,防止生成有害或恶意的图片。
此外,有鉴於这模型可被用於生成Deepfake影像,所有以Titan生成的图片都会加入看不见的浮水印,以利辨识AI生成的图片。不过Amazon并未说明技术资讯。《The Verge》引述AWS主管指出,这浮水印不会破坏图片画质,也无法被裁切或压缩掉,但使用者需要连结到独立API以判别是否为AI生成。
AWS还为Bedrock新增了2个Titan文字生成模型Titan Text Express及Text Lite。Titan Text Express为「价格和效能兼顾」的文字生成模型,提供最多8000 token输入,也可以微调。它支援的情境包含检索增加生成(retrieval-augmented generation)、开放式文本生成、脑力激荡、摘录重点、程式码及表格生成、文本改写、改述(paraphrasing)、关联思考(chain of thought)、撷取、问答及聊天等。
而Text Lite版则是为特定使用场景而设计,强调「具成本效益且可高度客制化」的LLM。Lite版最大输入为4000 token,支援场景包括摘录重点及文案写作(copywriting)。
Titan Text Express目前已正式推出英文版,并有100多个语言版本已以预览版上线,Titan Lite则仅支援英文。
除了主打的图片生成模型外,AWS昨日还推出Titan多模嵌入(Titan Multimodal Embedding)模型。此一模型可支援多模态提示输入,包括文字、图片或者两者同时输入。Titan多模嵌入模型支援输入最高128 token及25MB图片,仅支援英文。
Titan多模嵌入提供非同步批次API,Amazon OpenSearch Service的神经搜寻(Neural Search)很快也会加入连接器,以便加入Titan多模嵌入模型支援。