大数据AI产品月刊-2025年6月-阿里云开发者社区

通过 DataWorks 数据集成服务，实现将存储在 MaxCompute 中的大规模结构化数据导入 Milvus。充分整合了 MaxCompute 的复杂逻辑计算能力和 Milvus 的高维向量检索优势，适用于电商用户行为分析、医疗知识库构建及游戏内容推荐等多种场景应用，实现多模态数据的融合分析，助力企业实现智能化数据转型。

PAI 推理重磅发布模型权重服务，大幅降低冷启动与扩容时长

阿里云人工智能平台 PAI 平台推出模型权重服务，通过分布式缓存架构、RDMA 高速传输、智能分片等技术，显著提升大语言模型部署效率，解决模型加载耗时过长的业界难题。实测显示，Qwen3-32B 冷启动时间从953秒降至82秒，扩容时间缩短98.2%。

新模型速递：PAI-Model Gallery 云上一键部署 MiniMax-M1 模型

MiniMax 公司6月17日推出4560亿参数大模型 M1，采用混合专家架构和闪电注意力机制，支持百万级上下文处理，高效的计算特性使其特别适合需要处理长输入和广泛思考的复杂任务。阿里云 PAI-ModelGallery 现已接入该模型，提供一键部署、API 调用等企业级解决方案，简化 AI 开发流程。

PAI-TurboX：面向自动驾驶的训练推理加速框架

PAI-TurboX 针对自动驾驶领域的训练与推理难题，提出系统性加速解决方案。通过系统级优化（CPU 亲和性、内存管理等）、数据侧加速（高效 DataLoader、智能样本分组）和模型侧优化（算子融合、设备重映射等），显著提升 BEVFusion、MapTR 等主流模型的训练效率。

四、最佳实践

DistilQwen-ThoughtX 蒸馏模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践

阿里云 PAI 团队开发的 OmniThought 数据集，其中包含了200万思维链。基于此数据集，我们还推出了 DistilQwen-ThoughtX 系列模型，可以通过 RV 和 CD分数对思维链进行筛选，训练得到的模型获得根据问题和本身的认知能力，生成变长思维链的能力。同时在 EasyDistill 框架中开源了 OmniThought 数据集和 DistilQwen-ThoughtX 模型的全部权重。这些模型在性能上超过了 DeepSeek-R1-Distill 系列。

Post-Training on PAI (1)：一文览尽开源强化学习框架在 PAI 平台的应用

阿里云人工智能平台 PAI 训练服务 PAI-DLC 支持主流强化学习开源框架的快速高效应用：Cosmos-RL：NVIDIA 推出的 LLM 强化学习训练框架，支持基于 Custom 一键提交 Cosmos-RL 框架任务。Ray：支持已有 Ray 训练脚本通过 PAI-DLC 直接提交。VeRL：字节跳动开源的强化学习与大模型对齐训练框架，PAI-DLC 支持用户提交 Ray/PyTorch 框架任务，结合 VeRL 能力一键提交大规模强化学习任务。

云上 AI 推理平台全掌握 (1)：PAI-EAS LLM 服务一键压测

阿里云人工智能平台 PAI 推理服务 PAI-EAS 提供专业的压测方案：丰富模式：支持固定并发测试、固定请求速率测试（每秒请求数）、极限吞吐测试等多种模式。操作便捷：按需模拟测试数据，零代码快速创建压测任务并一键执行。全面评估：自动生成 TTFT、TPOT、TPS、ITL、E2EL 等核心指标的平均值、中位数及P99数据。

云上玩转 Qwen3 系列之四：构建 AI Search RAG 全栈应用

使用 PAI-LangStudio 和 Qwen3，构建基于 AI 搜索开放平台 × Elasticsearch 的 AI Search RAG 智能检索应用。在 PAI- LangStudio 中, 使用 AI 搜索开放平台提供原子化 Embeding/Rerank 模型能力和 Elasticsearch 向量数据库，高效地处理大规模数据，结合大模型 LLM 分析能力，以快速构建一站式 AI Search RAG 增强搜索/混合检索的全栈应用能力。将 AI 智能信息检索与智能问答效率与准确率大大提升。

DistillQwen-ThoughtY：通过变长思维链蒸馏，全面提升模型推理能力！

阿里云 PAI 团队基于 EasyDistill 框架，创新性地采用推理冗余度(RV)和认知难度(CD)双指标筛选机制，实现思维链与模型能力的精准匹配，发布新一代推理模型 DistillQwen-ThoughtY。相关模型和数据集已在 hugging face/ModelScope 等开源社区开放，配套 EasyDistill 框架支持高效知识蒸馏。近期内将推出 DistillQwen-ThoughtY 模型在 PAI-ModelGallery 的一键部署、训练和评测实践。

大数据AI产品月刊-2025年6月

一、产品功能发布

二、产品活动

三、产品快讯

四、最佳实践

大数据与机器学习

热门文章

最新文章

相关电子书