xAI推出Grok2Meta新AI爬虫微软英伟达钢炮小模型DisneyAI机器人亮相
🤖 Meta 悄然推出新 AI 爬 虫 Meta External Agent
💻 微软发布全新Phi-3.5系列AI模型
🧠 Nvidia 推出 Mistral-NeMo-Minitron 8B 模型
🎨 Ideogram 推出 2.0 版本,挑战 Flux 和 Midjourney
🚀 OpenAI 开放 GPT-4o 调优功能,提供免费训练机会
🌐 Midjourney 推出网页版,现已免费开放试用
☁️ TensorWave 推出高性能低成本 AI 云服务
🔍 xAI 推出 Grok 2 早期测试版,主打实时数据接入
🎥 Disney AI 打造生动机器人,迈出动画与机器人融合新步伐
Meta 悄然推出新 AI 爬虫 Meta External Agent

Meta 近日悄然推出了一款名为 Meta External Agent 的新网络爬虫,旨在通过抓取互联网数据为 AI 模型提供训练素材。
这款新爬虫最早由 Dark Visitors 等监控网络抓取和机器人活动的公司识别出来。此外,互联网档案馆也在 Meta 的开发者网站上发现了该爬虫的版本历史记录,显示 Meta 在 7 月底更新了网站,公开了该爬虫的存在,但并未进行公开声明。
根据 Dark Visitors 的数据,目前全球约 25% 的热门网站封锁了 OpenAI 的 GPTBot,而只有 2% 的网站封锁了 Meta 的新爬虫。
微软发布全新Phi-3.5系列AI模型

微软于周二发布了全新Phi-3.5系列AI模型,作为今年4月推出的Phi-3模型的继任者。此次发布的Phi-3.5系列包括以下几个型号:
Phi-3.5 Mini :在多语言任务中超越了Llama 3.1 8B。
Phi-3.5 MoE :在推理能力方面优于谷歌的Gemini 1.5 Flash。
Phi-3.5 Vision :在处理多帧视觉任务时可与GPT-4o相媲美。
每个模型都具备令人瞩目的128,000个token上下文长度,能够有效处理冗长文档和复杂对话。此外,这些模型拥有42亿个参数,并且内置图像编码器,能够处理图像中的信息。
Nvidia 推出 Mistral-NeMo-Minitron 8B 模型

Nvidia 也展示了其全新 Mistral-NeMo-Minitron 8B 模型,这是对上个月与 Mistral AI 合作发布的 12B 版本的升级。
通过“剪枝”技术,Nvidia 删除了不必要的模型权重,并重新训练了这个大语言模型,以确保其精准性。其小巧的体积使得该模型非常适合特定应用,如手机应用和客户服务聊天机器人。
科技巨头 Microsoft 和 Nvidia 正在 AI 领域持续创新,推出更精简、更强大的新模型。
这些模型在多个基准测试中都达到了业界领先水平,与 Gemini 1.5 Flash 相媲美,部分测试中甚至接近 OpenAI 的 GPT-4o。
这些新模型在提升速度和效率的同时,依然保持了高精度。据报道,Nvidia 的 8B 模型与其 12B 前辈一样精确,但计算成本却降低了多达 40 倍。随着 AI 公司日益关注能耗和成本问题,这些紧凑的模型形式可能很快会成为与模型功能同等重要的因素。
Ideogram 推出 2.0 版本,挑战 Flux 和 Midjourney

知名 AI 图像生成平台 Ideogram 刚刚发布了全新的 2.0 版本,并免费开放给所有用户,向市场上的 Flux 和 Midjourney 发起挑战。
版本更新亮点:
色彩调色板选择 :用户现在可以选择自己的色彩调色板,更好地控制最终图像的色彩表现。
增强的文本渲染 :新版模型大幅提升了文本渲染的准确性,特别适用于贺卡、T 恤设计、海报和长文本插画等场景。
搜索功能 :所有公开的 Ideogram 图像现已可搜索,用户可以浏览超过 10 亿张图像,寻找灵感。
改进的图像连贯性 :2.0 版本提供了更高的人体解剖精度、眼睛对齐和更好的手部细节渲染效果。
这次更新进一步提升了 Ideogram 在文本生成图像领域的竞争力,成为创意工作者们的新利器。
OpenAI 开放 GPT-4o 调优功能,提供免费训练机会

OpenAI 宣布,开发者现在可以对 GPT-4o 进行定制化调优,使其更好地满足不同需求。此前,大型科技公司工程师能够使用最新、最强大的模型,而独立开发者往往只能依赖较为逊色的开源替代品。如今,情况已发生改变。
通过调优,开发者可以将模型的性能推向极限,进一步提升其准确性和效率。例如,定制化的 GPT-4o 版本可能在数学或编程等领域表现出色,有望超越行业基准并创下新纪录。
为了庆祝这一新的自定义功能,OpenAI 将在 9 月 23 日之前为组织每天提供 100 万个免费训练 token,用于模型的调优和优化。
Midjourney 推出网页版,现已免费开放试用

AI 生成图像工具 Midjourney 现已开放网页版,任何人均可免费试用一段时间。
如何使用:
输入提示词 :在网页顶部的“图片”栏中输入文本提示词,可以是简单的单词或复杂的描述。
生成图片 :点击“Create”标签,每个提示词会生成四个图片变体。
进一步操作 :你可以选择“重跑”同一提示词,获得四个新的变体,或选择喜欢的图片进行更多操作。

其他功能:
“变异”功能 :生成四个风格相似的新图像,可选择微调(“细微”)或大幅改变(“强烈”)。
“升级”功能 :生成更高分辨率的图像。
编辑工具 :在编辑器中,可以扩展图像边框、擦除部分图像并根据新提示词生成新的细节,还可以轻松切换图片的长宽比。

Midjourney 提供了一个简短的 2 分钟视频,详细介绍了这些功能。免费用户有 25 次免费生成图片的机会,之后需要付费。
此外,Midjourney 社区内有丰富的提示词资源和技巧供参考,帮助用户更好地发挥创意。
TensorWave 推出高性能低成本 AI 云服务
TensorWave 云服务采用 AMD Instinct MI300X 芯片,以卓越的性价比超越 Nvidia H100B,在大语言模型(LLM)领域表现出色。
主要特点:
轻松处理复杂 LLM :TensorWave 云能够轻松应对日益复杂且内存需求巨大的大语言模型。
单节点运行大规模模型 :可在单个节点上运行如 Llama 3.1 405B 等大规模模型。
推理缓存 :借助 TensorWave 的推理缓存技术,确保企业级操作的流畅性。
卓越性能,成本更低 :在提供高性能的同时,大幅降低运营成本,成为 AI 领域性价比的最佳选择。
xAI 推出 Grok 2 早期测试版,主打实时数据接入

xAI 开始向部分 X 平台的高级用户推出其全新 AI 模型 Grok 2 的早期测试版。Grok 2 依托实时数据,并通过 Flux.1 技术生成相对未过滤的 AI 图像。
详细信息:
Grok 2 现已在早期测试模式下向部分高级 X 用户开放。
该模型能够接入并利用来自 X 平台的实时信息,这使其与 ChatGPT 和其他大型语言模型(LLMs)有所区别。
Grok 2 提供两种模式:常规模式和“趣味”模式,后者展现出更为独特和富有娱乐性的个性。
在新闻采集和总结过程中,Grok 2 可以引用特定的推文,这是 ChatGPT 和 Claude 等 AI 模型所不具备的能力。
Grok 2 相较于其他顶级 AI 聊天机器人(如 ChatGPT)的最大优势在于其实时信息接入能力和未过滤的响应输出。此外,据传 Grok 3 将于 2024 年底推出,xAI 在短时间内已证明自己是大型语言模型竞赛中的有力竞争者。
Disney AI 打造生动机器人,迈出动画与机器人融合新步伐

ETH Zurich 与 Disney Research 的科学家们开发了一套 AI 系统,能够通过简单的文本或图像输入,为虚拟角色和机器人生成逼真、符合物理规律的动作。
详细信息:
该系统采用两阶段方法:首先从大型数据集中学习动作的潜在表示,然后使用强化学习训练控制策略。
系统可处理多种动作,从简单的行走到复杂的杂技表演,表现优于以往方法,在精度和泛化能力上有显著提升。
该 AI 系统能够适应物理约束,使其能够将动作转移到真实机器人上,同时保持平衡和风格。
版权声明:
作者:shadowrocket
链接:https://www.shadowrocket8.top/213.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论