Google上周在AI大会上宣布可将文字转成影片的AI模型Imagen,将透过测试用App AI Test Kitchen开放特定国家用户测试。此外,另一AI模型Phenaki产生的影片也首次问世。
Google执行长Sundar Pichai贴出一段蓝色汽球与长颈鹿的影片,并说,这是Google首次分享以文字提示产生具有条理,并以Imagen Video系统增进品质的超高解析度影片。
Imagen、Phenaki是Google上个月公布的两个文字转影片的AI模型,前者强调具有深刻语言理解能力,能生成相片等级影片,而後者则能将多段文字提示合成长度较长、包含不同场景的影片。不同於Imagen仅能生成数秒影片,Phenaki则可生成长数分钟的影片。
Imagen将透过AI Test Kitchen App开放给美、英、加拿大、澳洲、纽西兰及肯亚的英语用户测试。Google 8月宣布AI Test Kitchen App,主要用於测试Google AI技术。Google第一批测试的技术是对话AI模型LaMDA(Language Model for Dialogue Applications)。
9to5Google报导,最新在AI Test Kitchen App测试的Imagen包含2个主题,一是City Dreamer,用户输入关於对城市想像的一连串文字提示,由Imagen生成影片。Wobble也是由用户输入文字提示让Imagen生成影片,只是主题变成了怪物。
Google希望能藉此挑战OpenAI的 DALL-E 2、Stability AI的Stable Diffusion,或是Meta的Make-A-Video。OpenAI的DALL-E 2於9月正式开放所有用户试用。Meta的Make-A-Video也已经在9月底开放给社群试用。