Skip to content
@DeepLink-org

DeepLink

Website HOT   |   Documents Tutorial
 

小红书 | 知乎 | CSDN

人工智能开放计算平台-DeepLink,作为芯片与深度学习框架适配的“桥梁”,根本性实现软硬件解耦,建设开放的软硬件适配生态。基于 DeepLink,可支持国产多芯片异构、跨域的训推一体化工具链(输入输出标准化);上下游厂商通过一次适配即可深度接入算法生态,从根本上打破生态壁垒,实现软硬件解耦和算力要素多样化。

适配中间件

数字智能

  • DITorch:设备无关 torch。
  • DLCompiler:扩展 Triton 的深度学习编译器。
  • DLBlas:一个基于 Triton 的运算符库。
  • DLSlime:提供了一套点对点(Peer-to-Peer)通信接口。
  • DLinfer:一套将国产硬件接入大模型推理框架的解决方案。
  • NanoDeploy:专注分离式架构与高性能专家并行的高可用智能体推理服务框架。

物理智能

  • 3DGSTensorCore:3DGS渲染的加速模块,可以即插即用至常用的3DGS加速框架上。
  • RLightning:统一原型开发与规模扩展的具身智能强化学习框架。

训推系统

  • LightRFT:一个先进的多模态强化学习微调框架,专为大语言模型(LLM)和视觉语言模型(VLM)设计。
  • Pulsing: 是一个轻量级分布式 Actor 框架,专为 LLM 推理服务设计。
  • Persisting:参数、键值缓存和轨迹的持久存储。

混训混推

  • 支持异构/跨域混训、异构推理等的相关方案,敬请期待.

智算平台

  • Deeptrace:一种分布式训练中任务排查、诊断的实现方案。
  • probing:一个专为AI应用设计的运行时性能分析和调试工具。

训推性能建模与通信建模

  • 服务下一代模型与下一代算力建设的方案&工具,敬请期待。

前沿技术

量子计算

  • OpenTenNet:在新兴算力硬件上构建的量子计算模拟器。

超节点

  • 面向极致算力增长需求构建的国产超节点技术系统,敬请期待。

硬件评测

  • AIChipBenchmark:面向国产深度学习加速卡进行的多维度评测工作.

Popular repositories Loading

  1. DLSlime DLSlime Public

    Composable and Embeddable Communication Runtime for Distributed AI Services

    C++ 101 9

  2. deeplink.framework deeplink.framework Public

    Python 77 33

  3. DIOPI DIOPI Public

    Python 76 35

  4. dlinfer dlinfer Public

    Python 72 15

  5. DLCompiler DLCompiler Public template

    triton for dsa

    Python 65 10

  6. 3DGSTensorCore 3DGSTensorCore Public

    Python 61 4

Repositories

Showing 10 of 74 repositories

Top languages

Loading…

Most used topics

Loading…