bibo必博特斯拉分享了一段第二代Optimus人形机器人的工作视频,视频显示,该机器人可将电池单体精确地插入托盘中。特斯拉官方表示训练并部署了一个神经网络,允许Optimus开始执行有用的任务,例如从传送带上捡起电池单体并精确地将它们插入托盘中。这个神经网络完全端到端运行,只使用来自机器人的2D摄像头以及板载的本体感知传感器的视频,并直接产生关节控制序列。马斯克此前在一季度财报电话会议上表示,预计在今年底之前,特斯拉的Optimus人形机器人将拥有完成“有用的”工厂任务的能力,可能会在2025年底前将其对外销售。
微软Start团队发布了一款数据驱动AI天气预测模型,能够准确预测未来30天的天气情况。该模型结合了五种不同的人工智能模型和三种深度学习架构,利用过去数十年的天气数据进行训练,能够学习并模拟复杂的气象变化规律。在预报准确率和计算效率上均有突破。在预估未来一周的天气预报方面,新AI模型的气温准确率比目前欧洲中期天气预报中心(ECMWF)的模型高出17%。ECMWF模型依赖超级计算机进行大量计算,新AI模型能够在单个NVIDIAV100图形处理单元上运行,在不到两小时的时间内产生100个30天的预测结果,大大减少了计算资源的需求。
南开大学HVision团队发布了StoryDiffusion这一可以保持角色一致,生成多图漫画和长视频的工具。通过Consistentself-attention和Motionpredictor,该工具能够生成连贯的图像和视频。StoryDiffusion的应用范围广泛,可用于漫画生成、图像转视频等多种场景,根据用户提供的文本提示,生成角色连贯的图像序列,通过预测不同图像之间的运动,能够进一步生成长视频。
AI音乐工具Udio宣布更新功能,致力于帮助用户创作出更长、更连贯的音乐作品。Udio的更新中,上下文窗口得到了扩展,现在用户在扩展一首歌曲的某个部分时,系统会考虑该部分前后最长两分钟的内容,使得歌曲在过渡和整体结构上更加流畅和自然。对于想要制作长篇混音、环境音乐或复杂前卫摇滚的音乐制作者来说,Udio现可支持长达15分钟的音轨制作。
Adobe公司推出3D技术ProjectNeo,通过3D元素和效果的整合,提升传统2D图形设计的视觉效果和制作效率。借助ProjectNeo,用户可以为图标和动画插图创建独特的3D形状。该工具具备强大的风格化和造型功能bibo必博,允许用户从不同角度对作品进行风格化和塑形,创建出引人注目的矢量和等距插图,并支持导出高质量的SVG文件。此外,ProjectNeo与Adobe的桌面和网络应用程序实现了无缝集成。
HeyGen公司推出一款自动视频剪辑工具InstantHighlights1.0,旨在为用户提供更便捷的视频编辑体验,简化视频内容的多平台适配工作,提高内容传播效率。用户上传视频或粘贴视频链接,并选择语言,该工具将自动把视频剪辑成不同语言配音的短片,方便用户将内容分发到YouTube、Instagram、TikTok等多种平台上。此外,HeyGen还发布了AvatarinMotion1.0技术,实现了虚拟角色的动作捕捉和声音克隆,拓宽了虚拟角色在多个领域的应用潜力。
美国宾夕法尼亚大学科学家研制出一款可在600℃高温下持续工作60小时的存储器。这一耐受温度是目前商用存储设备的两倍多,表明该存储器具有极强的可靠性和稳定性。该设备由金属—绝缘体—金属结构组成,包括镍和铂电极以及一层45纳米厚的AlScN。这种结构设计使该存储器能与高温碳化硅逻辑器件兼容,与专为极端温度设计的高性能计算系统协同工作,有望在可导致电子或存储设备故障的极端环境或恶劣条件下应用bibo必博。
迁移科技完成数千万元B轮融资,由善达基金领投。迁移科技表示,本轮融资主要用于深化3D视觉产品全球化市场销售体系,加强底层技术研发以及3D视觉产品标准化,携手集成商伙伴实现3D视觉生态共赢。迁移科技成立于2017年,是一家3D工业相机和3D视觉系统供应商,累计完成了数亿元融资,致力于打造稳定、易用的AI+3D视觉系统,可应用于上下料、拆码垛、定位装配等场景,为全球工业制造和仓储物流自动化技术赋能。