—飞狐— 发表于 昨天 15:32

META推出文本生成3D模型工具

道琼斯指数+0.66%,标普500指数+1.95%,纳斯达克指数+3.5%。宏观经济:美联储主席鲍威尔表示,央行在降通胀方面取得了“相当大进展”,最新经济数据表明通胀率正在回到下行轨道。美联储6月会议纪要显示,官员们正在等待更多支持通胀降温的证据,但对于高利率应该持续多长时间存在意见分歧。美国劳工部数据显示,上周首次申领失业救济人数增加4,000人,达到238,000人。
Runway宣布其视频模型Gen-3Alpha现在向所有用户开放付费使用。版本比之前的Gen-2具有更精细的动作控制、逼真的人物生成、多模态输入和先进的专业创作工具。Gen-3在图像真实性、场景连贯性和动态表现上都有显著提升,助力构建通用世界模型。用户可以通过输入提示词和修饰词来生成视频,通过选择视频时长和种子编号来获得一致或不同的结果。虽然Gen-3功能强大,但一些网友发现视频在全景或中景时存在人物肢体变形的问题。尽管如此,视频的整体氛围和质感仍然出色。与前代不同,Gen-3需要付费使用,每月至少12美元。Meta公司推出了一款名为Meta3D-Gen的文本生成3D模型工具。用户可以在一分钟内生成包括人物、动物、道具等在内的多种类型的高质量3D模型。该工具能够生成高分辨率纹理和材质贴图,并且支持物理渲染,适用于游戏开发、电影制作、虚拟现实和建筑设计等领域。Meta3D-Gen的核心模块包括多视图到3D重建和3D纹理细化,通过使用自研的Emu模型和优化表示法,以及神经网络融合技术,实现了高效率和高质量的3D模型生成。在性能测试中,Meta3D-Gen在多个关键指标上超越了现有模型,并且生成效率比现有模型快3到60倍。

微软公司开源了一项名为GraphRAG的新技术。这是一种基于图的检索增强生成(RAG)方法,专门设计用于处理私有或未见过的数据集的问答任务。GraphRAG通过结合大型语言模型(LLMs)构建知识图谱和图机器学习技术,显著提升了对私有数据的处理能力,尤其是在跨大型数据集进行复杂语义问题推理方面表现出色。在GitHub上发布后,GraphRAG迅速获得了社区的高度认可,获得了2700颗star。微软的研究表明,在大规模数据集上,GraphRAG在全面性、多样性和赋权性方面均优于传统RAG技术。
埃隆马斯克宣布xAI的Grok2将于8月推出,Grok3将于年底推出。新一代大语言模型Grok3将用近10万个NVIDIAH100GPU训练,预计年底发布。同时,xAI即将推出Grok2,预计将在数据训练方面实现重大飞跃。Grok2有效的解决了不同模型生成同样错误的问题,Grok2训练时从互联网语料中清除掉LLM合成的错误数据,从而形成高质量数据集。
马斯克宣布计划购买10万张H100训练Grok3,我们认为AI算力及基础设施需求仍处于较高水平,建议持续关注AI硬件发展。同时,Meta及Runway相继推出多模态产品,AI技术应用正在从LLM向多模态发展,推动了模型能力快速迭代,也催生新的商业模式和服务,建议关注模型和产品端迭代。
(以上数据出自新浪财经天风证券研究所孔蓉2024.07.09)

全文完!
页: [1]
查看完整版本: META推出文本生成3D模型工具