京东开源JoyAI-LLM-Flash大模子:手艺打破赋能AI应用新能够
2026-02-16 13:56:01
京东近日在Hugging Face平台正式推出其最新研发的大语言模型——JoyAI-LLM-Flash,标志着这家电商巨头在人工智能领域迈出关键一步。该模型采用混合专家架构(MoE),总参数规模达48亿,其中仅3亿参数处于激活状态,通过优化设计实现高效计算。在预训练阶段,模型处理了超过20万亿文本Token,展现出对前沿知识的深度理解能力、逻辑推理水平以及编程相关技能。
技术团队创新性地引入纤维丛理论构建强化学习框架,开发出名为FiberPO的优化系统。该框架结合Muon优化器与稠密多Token预测技术,有效解决了传统大模型在规模扩展时面临的训练不稳定问题。实验数据显示,采用新架构的模型吞吐量较非MTP版本提升1.3至1.7倍,显著提高了训练效率与工程应用潜力。
模型架构设计突破多项技术指标:40层深度网络结构支持128K超长上下文窗口,词表容量扩展至129K,能够处理更复杂的语言任务。这种架构设计既保证了模型对长文本的连贯理解能力,又通过专家模块的动态激活机制控制计算开销。京东方面表示,该模型的开源将为学术界和产业界提供新的技术基准,推动大模型在电商、物流等垂直场景的落地应用。
声明:文章不代表轻松科技观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!
相关阅读
-
身体这两个部位乱推拿真的会要命,快停止科技前沿 2026-03-09 14:26:16
-
不会写代码也能用,OpenClaw若何帮通俗人脱节反复任务,提拔效率?深度解读 2026-03-09 14:22:05
-
比特币价格预测:2025 年底 15 万美元还是跌至 8.5 万?关键支撑位分析科技前沿 2026-03-09 14:11:28
-
小米2026届春季校园雇用启动:触及芯片、算法等20职类,需多轮测试科技前沿 2026-03-09 14:08:45
-
AI设计新神器来袭:无需专业技能,一句话解锁巨匠级海报创作资讯百科 2026-03-09 14:05:50
-
又一爆款预定,吉祥银河M7将于3月13日表态:1730km超长续航科技前沿 2026-03-09 14:03:26
-
2026百度Apollo Park参访:解锁智能驾驶手艺落地密码,赋能企业转型资讯百科 2026-03-09 14:00:39
-
国内油价本日将迎年内最大涨幅,网友实拍多地加油站排长队科技前沿 2026-03-09 13:57:03
-
智能办公本怎样选?科大讯飞X5等四款抢手产物功能特点大比拼,帮你找到心头好资讯百科 2026-03-09 13:55:27
-
谁动了稳定币的锚?复盘历年重大脱锚事件,一文汇总科技前沿 2026-03-09 13:54:08