AI项目和框架
AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
新Voost – 创新的双向虚拟试穿和试脱AI模型
Voost 是NXN实验室推出创新的虚拟试穿和试脱模型,基于统一且可扩展的扩散 Transformer(DiT)框架开发。能同时处理虚拟试穿(try-on)和试脱(try-off)任务...
新Skywork UniPic 2.0 – 昆仑万维开源的统一多模态模型
Skywork UniPic 2.0 是昆仑万维开源的高效多模态模型,专注于统一的图像生成、编辑和理解能力。模型基于2B参数的SD3.5-Medium架构,通过预训练、渐进式双任务...
AI Sheets – Hugging Face开源的无代码数据处理工具
AI Sheets 是 Hugging Face 开源的无代码数据处理工具,提供类似 Excel 的界面,让用户通过自然语言提示轻松调用数千种开源 AI 模型,完成数据的构建、丰富和...
Matrix-3D – 昆仑万维开源的3D世界模型
Matrix-3D 是昆仑万维 Skywork AI 团队推出的用在生成可探索全景3D世界的框架。框架结合全景视频生成与3D重建,从单图像或文本提示出发,生成高质量、全向可...
RynnEC – 阿里达摩院推出的世界理解模型
RynnEC是阿里巴巴达摩院推出的世界理解模型 (MLLM),专门用在具身认知任务。模型能从位置、功能、数量等11个维度全面解析场景中的物体,支持物体理解、空间...
RynnRCP – 阿里达摩院开源的机器人上下文协议
RynnRCP 是阿里达摩院开源的机器人上下文协议(Robotics Context Protocol),能打通具身智能开发全流程。RynnRCP 包含 RCP 框架 和 RobotMotion 两大模块,...
RynnVLA-001 – 阿里达摩院开源的视觉-语言-动作模型
RynnVLA-001 是阿里达摩院推出的视觉-语言-动作模型。模型通过在大量第一人称视角的视频上进行预训练,学习人类操作技能,并隐式迁移到机器人手臂的操控中。
Matrix-Game 2.0 – 昆仑万维推出的自研世界模型
Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,全面开源,推动交互式世界模型领域的发展...
GLM-4.5V – 智谱开源的最新一代视觉推理模型
GLM-4.5V是智谱开源的最新一代视觉推理模型。模型基于106B参数规模构建,拥有12B激活能力,是目前领先的视觉语言模型(VLM)。模型在GLM-4.1V-Thinking的基础...
MiroFlow – 多Agent系统开发框架,支持高并发处理
MiroFlow是强大的多智能体系统开发框架,专为构建复杂、高性能的AI智能体而设计,为MiroThinker等模型生成高质量的智能体轨迹数据。框架具备可复现的性能,在...