蚂蚁数据智能技术_个人页

蚂蚁数据智能技术
个人头像照片
34
0
0

个人介绍

暂无个人介绍

擅长的技术

  • DB - GPT
  • 智能化商业洞察平台
  • HoraeDB
  • VSAG
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年07月

2025年06月

2025年05月

2025年04月

  • 04.24 16:22:49
    发表了文章 2025-04-24 16:22:49

    ICLR 2025 | EDiT:一种基于 Local SGD 策略的大模型高效分布式训练方法

    蚂蚁 AI Infra 团队在深度学习最核心之一的训练框架方向上持续投入与创新,实现了提升资源利用率、加速训练、提升训练稳定性等目标。我们提出的 EDiT 方法,即为其中一项工作。
  • 04.07 10:08:26
    发表了文章 2025-04-07 10:08:26

    大模型存储的 “最后一公里” :蚂蚁大模型存储加速系统 PCache 如何解决万亿参数训练难题?

    本文尝试通过当前学术和工业界在大模型存储领域的关注点和相关工作,并结合蚂蚁大模型训练场景实际的需求和问题,来介绍蚂蚁是如何在多云环境里构建一套具备高可用性、高性能以及低成本的云原生 AI 存储加速系统 PCache;并通过该存储方案在蚂蚁支持了百亿文件规模的多模态和万亿参数的 MOE 训练任务。
  • 04.07 09:53:22
    发表了文章 2025-04-07 09:53:22

    DeepSeek 3FS解读与源码分析(5):客户端解读

    本文深入解析了3FS的客户端模式,包括FUSE Client和Native Client(USRBIO)。
  • 04.03 14:16:45
    发表了文章 2025-04-03 14:16:45

    DeepSeek 3FS解读与源码分析(4):Meta Service解读

    在当今数字化时代,随着数据量的爆炸性增长,分布式文件系统已成为处理大规模数据存储和访问的核心技术之一。DeepSeek 开源的 3FS(Fire-Fly File System)作为一款高性能、高可用的分布式文件系统,凭借其创新的设计和强大的功能,吸引了众多开发者的关注。其中,Meta Service 作为 3FS 的核心组件之一,承担着元数据管理的关键职责,是整个文件系统高效运行的基石。 在本文中,我们将深入探讨 3FS 中 Meta Service 的架构设计、关键特性以及其实现机制。
  • 04.03 14:06:15
    发表了文章 2025-04-03 14:06:15

    DeepSeek 3FS解读与源码分析(3):Storage模块解读

    2025年2月28日,DeepSeek 正式开源其颠覆性文件系统Fire-Flyer 3FS(以下简称3FS),重新定义了分布式存储的性能边界。本文将结合代码和design_notes 对storage部分进行分析和探讨。
  • 04.02 19:00:34
    发表了文章 2025-04-02 19:00:34

    Ray Flow Insight:让分布式系统调试不再"黑盒"

    作为Ray社区的积极贡献者,我们希望将这些实践中沉淀的技术能力回馈给社区,推动Ray生态在实际场景中的应用深度和广度。因此,2024年底我们做了激活AntRay开源社区的决策,AntRay会始终保持与官方Ray版本强同步(即AntRay会紧随Ray官方社区版本而发布),内部Feature亦会加速推向AntRay以开源研发模式及时反哺内部业务,同时会将社区关注的Feature提交至Ray官方社区,实现内外部引擎双向价值流动。后续我们会以系列文章形式同步蚂蚁推向开源的新特性,本文将重点介绍:Ray Flow Insight —— 让分布式系统调试不再"黑盒"。

2025年03月

2024年10月

  • 10.12 15:45:29
    发表了文章 2024-10-12 15:45:29

    【9月重点功能发布】DB-GPT v0.6.0 版本更新,向量索引库 VSAG 全新发布......

    让我们一起回顾蚂蚁数据技术在九月的大事记~
  • 10.11 14:49:01
    发表了文章 2024-10-11 14:49:01

    DB-GPT 首期源码解读系列直播回顾(视频版)

    🚀 DB-GPT首期源码解读系列上线啦! ✨直播视频看点满满:项目发起人陈发强亲临,初次剖析架构,完整呈现从设计思考到架构逻辑的全过程,让你全面了解 DB-GPT。
  • 10.08 11:46:56
    发表了文章 2024-10-08 11:46:56

    OceanBase CTO杨传辉谈AI时代下数据库技术的创新演进路径!

    在「DATA+AI」见解论坛上,OceanBase CTO杨传辉先生分享了AI与数据库技术融合的最新进展。他探讨了AI如何助力数据库技术演进,并介绍了OceanBase一体化数据库的创新。OceanBase通过单机分布式一体化架构,实现了从小规模到大规模的无缝扩展,具备高可用性和高效的数据处理能力。此外,OceanBase还实现了交易处理、分析和AI的一体化,大幅提升了系统的灵活性和性能。杨传辉强调,OceanBase的目标是成为一套能满足80%工作负载需求的系统,推动AI技术在各行各业的广泛应用。关注我们,深入了解AI与大数据的未来!
  • 10.08 11:32:33
    发表了文章 2024-10-08 11:32:33

    从数据积累到大模型的智能飞跃,你准备好了吗?

    在数据驱动的时代,人工智能(AI)正重塑世界。蚂蚁集团的师文汇在「DATA+AI」论坛上发表演讲,阐述了《数据驱动的AI原生应用与开放框架》。他指出,AI应用经历了从数据积累到大模型的智能飞跃,数据已成为智能应用成功的关键。师文汇强调,构建智能应用需结合优质大模型与行业数据。演讲还介绍了AI原生应用的研发变革与挑战,包括编程模型转变、研发范式的不确定性及与现有系统的交互等问题。此外,他还分享了AI原生应用框架的思考与探索,提出了泛ETL、实验反馈机制及应对不确定性等解决方案,并展示了DB-GPT在政企、金融等多个领域的应用案例。
  • 10.08 11:17:14
    发表了文章 2024-10-08 11:17:14

    DB-GPT v0.6.0 版本更新,发布六大核心新特性!

    DB-GPT v0.6.0 版本已发布,这是一个开源的AI原生数据应用开发框架,带来了多项新特性,包括AWEL协议升级至2.0,支持复杂编排;改进的数据应用创建与生命周期管理,支持多模式构建;GraphRAG增强图社区摘要与混合检索,图索引成本降低50%;丰富的Agent Memory类型;支持Text2NLU与Text2GQL微调;GPT-Vis前端可视化升级。这些更新助力企业快速构建智能数据应用,推动数字化转型。

2024年09月

  • 09.30 18:11:06
    发表了文章 2024-09-30 18:11:06

    独家直播|DB-GPT架构设计与源码解读(第一期)

    🚀 DB-GPT首期源码解读系列上线啦! 10.8 晚7点,与DB-GPT项目发起人陈发强一起,深入探索DB-GPT的架构设计与源码解读。 🔎 直播看点: ● 架构全剖析:从设计思考到架构逻辑,全面剖析DB-GPT。 ● 源码速度解读:多模型管理、智能体、RAG、AWEL等核心模块一网打尽。 ● 项目作者面对面:陈发强,蚂蚁集团DB-GPT开源项目发起人,分享实战经验与洞见。 ● 有问必答:围绕DB-GPT的使用问题有问必答,线上帮你解issue! 👉 立即扫码预约,与DB-GPT作者零距离交流!
  • 09.30 18:03:05
    发表了文章 2024-09-30 18:03:05

    在Data-Driven时代下,如何打造下一代智能数据体系?

    本文源自2024外滩大会“Data+AI”论坛,由蚂蚁集团数据平台与服务部负责人骆骥演讲整理。文章回顾了数据技术发展历程,指出生成式AI正推动数据技术从成本效率中心向价值中心转变。
  • 09.30 17:39:15
    发表了文章 2024-09-30 17:39:15

    蚂蚁集团开源项目 DB-GPT 和 VSAG 惊艳亮相,引领 AI 数据革命!

    9月5日,在2024 Inclusion·外滩大会“从DATA for AI到AI for DATA”见解论坛上,由蚂蚁集团发起的,旨在提高数据库与大模型应用开发效率的“星辰智能社区”新发布了两个项目:AI原生数据应用开发框架DB-GPT新版本与向量索引库VSAG。
  • 09.30 17:21:14
    发表了文章 2024-09-30 17:21:14

    外滩大会热议:AI时代数据价值转变,如何打造下一代智能数据体系?

    9月5日,2024 Inclusion·外滩大会举办“从DATA for AI到AI for DATA”论坛,蚂蚁集团、上海交通大学和复旦大学联合主办,探讨AI时代数据价值的转变。中国工程院院士郑纬民和新加坡工程院院士颜水成等专家参会,分享了数据技术变化趋势及与AI融合的最新进展。论坛强调大模型对数据技术的需求推动了存储、生产和加工等各环节的技术革新,并探讨了合成数据和智能数据体系的重要性。

2024年08月

  • 08.23 12:08:39
    发表了文章 2024-08-23 12:08:39

    好玩不止《黑神话:悟空》,最科技city walk 2024外滩大会等你来逛!

    🎉伙伴们!9月5日,蚂蚁数据部联合上海交通大学、复旦大学于上海 2024 外滩大会举办「DATA+AI」见解论坛。 DB-GPT最新大版本重磅功能将在本次论坛正式发布。 知名学者与行业领袖齐聚,带领我们在数据智能💻领域不断探索前进!
  • 发表了文章 2025-07-04

    大模型推理显存优化系列(3):FlowMLA——面向高吞吐的DP MLA零冗余显存优化

  • 发表了文章 2025-07-03

    社区Committer LofiSu:在Apache Fory,每一份贡献都不会被忽视

  • 发表了文章 2025-07-03

    新晋社区PMC李攀:“在Apache Fory,技术实力是唯一的通行证”

  • 发表了文章 2025-06-30

    从性能优化赛到社区Committer,走进赵宇捷在Apache Fory的成长之路

  • 发表了文章 2025-06-24

    从用户到社区Committer:小米工程师隋亮亮的Apache Fory成长之路

  • 发表了文章 2025-06-16

    DB-GPT V0.7.2 版本更新:图表组件可视化增强、支持混合搜索 、支持DeepSeek-R1-0528模型等

  • 发表了文章 2025-06-06

    万字长文详解|DLRover LLM Agent:大模型驱动的高效集群资源调优

  • 发表了文章 2025-05-30

    ⼤模型驱动的DeepInsight Copilot在蚂蚁的技术实践

  • 发表了文章 2025-05-30

    最高万元奖金|2025开源之夏x蚂蚁数据智能,12大硬核任务等你解锁

  • 发表了文章 2025-05-21

    千亿级向量索引的秘密武器:一文详解蚂蚁集团的工程实践和开源突破

  • 发表了文章 2025-05-07

    DB-GPT V0.7.1 版本更新:支持多模态模型、支持 Qwen3 系列,GLM4 系列模型 、支持Oracle数据库等

  • 发表了文章 2025-04-24

    ICLR 2025 | EDiT:一种基于 Local SGD 策略的大模型高效分布式训练方法

  • 发表了文章 2025-04-07

    大模型存储的 “最后一公里” :蚂蚁大模型存储加速系统 PCache 如何解决万亿参数训练难题?

  • 发表了文章 2025-04-07

    DeepSeek 3FS解读与源码分析(5):客户端解读

  • 发表了文章 2025-04-03

    DeepSeek 3FS解读与源码分析(3):Storage模块解读

  • 发表了文章 2025-04-03

    DeepSeek 3FS解读与源码分析(4):Meta Service解读

  • 发表了文章 2025-04-02

    Ray Flow Insight:让分布式系统调试不再"黑盒"

  • 发表了文章 2025-03-26

    DB-GPT V0.7.0版本更新:支持MCP协议、集成DeepSeek R1模型、GraphRAG检索链路增强、架构全面升级等

  • 发表了文章 2025-03-25

    Deepseek 3FS解读与源码分析(2):网络通信模块分析

  • 发表了文章 2025-03-25

    DeepSeek 3FS解读与源码分析(1):高效训练之道

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息