新鲜AI产品点击了解:https://top.aibase.com/
2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
6. AI Agent变得更好。Agent不仅会成为主流并在现实世界中找到用例,而且还会开始表现出类似人类的行为。我们将在植物学、市场营销、游戏理论等领域使用Agent来帮助我们预测人类行为。
要点:站长之家(ChinaZ.com) 1月3日 消息:阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。