新Nanonets-OCR-s – Nanonets推出的OCR模型
Nanonets-OCR-s(Nanonets OCR Small)是Nanonets推出的图像到 Markdown 的 OCR 模型,支持将图像中的文档内容转换为结构化的 Markdown 格式。模型能提取文本...
新迅雷MCP – 迅雷推出的AI自动下载MCP服务
迅雷MCP是迅雷推出的创新服务,将AI与数字内容下载深度融合。用户只需在支持该服务的AI应用(如纳米AI、扣子空间等)中发出指令,AI能自动找到所需资源启动下...
新clikka.ai – AI产品摄影工具,一张照片生成4个角度视图
clikka.ai 是AI产品摄影工具。用户只需上传产品图片,30秒内能获得专业品质的照片。工具具备风格匹配功能,能基于上传风格参考照片,复制其灯光和氛围,实现...
新VLN-R1 – 港大联合上海AI lab推出的具身智能框架
VLN-R1是香港大学和上海人工智能实验室联合推出的全新具身智能框架,基于大型视觉语言模型(LVLM)直接将第一人称视频流转换为连续的导航动作。框架基于Habit...
新实测Kimi-Researcher,7个案例看懂Agent能干什么
最近,Kimi 推出基于端到端自主强化学习技术的 Kimi-Researcher(深度研究)Agent 模型并开启内测。第一时间申请到了内测资格,深度体验下来,发现Kimi不管是...
新Bob – 专为macOS平台设计的AI翻译和OCR软件
Bob是为macOS平台设计的翻译和OCR软件。Bob支持多种翻译方式,包括划词翻译、截图翻译、输入翻译等,支持10+翻译服务,如Apple翻译、Google翻译、百度翻译等...
新Game Worlds – Runway推出的AI游戏创作平台
Game Worlds 是 Runway 推出的 AI 游戏创作平台,通过 AI 技术帮助用户轻松创建个性化的游戏世界。平台支持用户通过简单的文本描述或上传图像,快速生成游戏...
新Twocast – AI双人播客生成器,模拟真实双人对话形式
Twocast是AI驱动的双人播客生成器,支持生成双人对话形式的播客内容。生成器支持多语言、多音色,且能基于主题、链接、文档等多种方式快速生成3-5分钟的播客。
新课件帮 – AI课件制作平台,一键生成数字人视频课件
课件帮是数字人视频课件智能创作平台。基于AI技术,快速生成数字人视频课件,1分钟搞定制作。平台基于主题自动生成PPT大纲及内容,将已有文本资料转化为PPT,...
新Kwai Keye-VL – 快手推出的多模态大语言模型
Kwai Keye-VL 是快手自主研发的多模态大语言模型,基于 Qwen3-8B 语言模型整合SigLIP初始化的视觉编码器,支持动态分辨率输入。模型能深度融合和处理文本、图...