Ba

Baichuan-M3-235B

聊天大模型

Baichuan-M3-235B

发布时间: 2026-01-13

102
模型参数(Parameters)
2350.0
最高上下文长度(Context Length)
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度
暂无数据
最长输出结果

2048 tokens

模型类型

聊天大模型

发布时间

2026-01-13

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0 - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
接口价格
暂无公开的 API 定价信息。

Baichuan-M3-235B模型在各大评测榜单的评分

当前尚无可展示的评测数据。

发布机构

Baichuan-M3-235B模型解读

模型简介

Baichuan-M3-235B 是百川智能(Baichuan Intelligence)最新一代医疗增强类大语言模型,紧随 Baichuan-M2 之后推出。目前该模型已在部分公开平台(如 Hugging Face)可见其模型卡信息,但官方技术文档尚未完全公开。模型设计围绕提高临床推理和医疗决策能力展开,尤其强调内在问诊推理路径建模。根据 TechWeb 报道,Baichuan-M3 在医疗基准 HealthBench 与 HealthBench-Hard 上显著优于前代和其它主流模型,并具备更低幻觉率和更高临床推理一致性。该模型目前已在 Hugging Face 上开放,并配有 README 与 quick start 信息,但截至目前尚无完整官方论文或技术报告。

架构与技术规格

Baichuan-M3-235B 是一个参数规模约 235B 的大语言模型(dense/未公开 MoE 分布),专注于医疗推理、临床问诊流程模拟与低幻觉表现。官方文档提及其采用 Fact-Aware 强化学习及细分流水线训练 (Segmented Pipeline Reinforcement) 等策略提升可靠性。

核心能力与支持模态

该模型主要针对医疗文本推理与诊断推理任务,未见官方指出支持其它模态输入,如图像或音频。

性能与基准评测

根据公开 Hugging Face 及 TechWeb 信息,Baichuan-M3 在权威医疗大模型评测 HealthBench 上取得领先成绩,并在复杂医疗决策子基准(HealthBench-Hard)中超越包括 GPT-5.2 在内的多个顶级模型。

访问方式与许可

模型代码与权重已托管在 Hugging Face 仓库,地址详见 huggingfaceUrl 字段。官方尚未发布对应的学术论文,但模型卡中有简要技术介绍。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat