2025交通大模型“群雄”并起:场景落地、方案构建及未来发展

发布时间:2025-8-22 2:15:06

2025年,交通大模型的建设推进动作频频。仅在8月中旬就迎来两项重要进展:13日,京雄高速公路河北段面向运营全业务场景的大模型体系正式上线,构建了施工规范智能监管、智慧设备智能联动、交通信息AI报亭、跨车型逃费智能稽核等6个大模型拓展应用场景;16日,交通大模型创新与产业联盟在北京正式成立,联盟在交通运输部指导下组建,由中国交通建设集团担任理事长单位,首批单位共55家,这标志着综合交通运输大模型建设从分散探索迈向协同共建的新阶段。


推动进展

从概念探索到场景落地



今年以来,国家大力推动人工智能与实体经济深度融合,加速大模型在垂直行业的落地应用,截至目前已有多个交通大模型发布。


2月,广西交科集团有限公司基于DeepSeek-R1自主研发的交通领域垂直大模型——“科宝”正式发布。该模型深度整合了高速公路建设、管理、养护、运营及服务全业务流程,实现了数据库信息的智能查询、专业规范的精准检索以及养护决策的智能推理等核心功能。


3月,陕西交控集团、山东高速集团、江西交投集团、河南交投集团、安徽交控集团、内蒙古交通集团等六省份交通企业联合发布了“经纬交通大模型”。该模型具备行业知识深度融合、全链路决策优化、安全可信赖体系等三大核心能力,旨在通过构建“四位一体”的模型能力框架,解决交通AI场景构建能力分散、通用大模型行业适配不足、技术标准不统一、数据要素价值挖掘不充分等行业难题,为行业提供高效、专业的智能化服务。


5月,中城交(上海)科技有限公司发布上海首个交通领域多模态大模型——通达大模型。它具备两项核心能力,一是担任“专家顾问”,为管理人员提供专业知识服务;二是辅助交通组织管理,通过视频监控和物联网设备,敏锐捕捉每个路口的车流量变化、周边道路的通行态势,在极短时间内完成海量数据模拟,精准制定交通信号优化方案。


6月,宁波交警携手大华股份正式发布交管行业实战AI大模型——宁波交警“鹰智”大模型。“鹰智”大模型构建了“通识问答+知识中枢+智能问数+以文搜图”四维赋能体系,助力宁波交警在法规检索、警情分析、数据研判、精准查缉以及事故追逃等场景实现高效应用。值得一提的是,宁波交警与大华股份创新研发了融合智能体,将具备差异化能力的不同智能体进行入口统一和自动协同,通过智能拆解与跨模块协作完成复杂任务,实现自然语义下复杂交通问题的“一站式”解决。


方案构建

算力 算法 数据

8cc7f9b21b2b25bdfc853557ae56feb5.jpg

总体架构图


大模型总体架构如上图所示。基础大模型通过大量通用数据集预训练,掌握多场景数据的丰富结构和模式,具备处理多种基础任务的能力,确保模型使用的广泛性和通用性。一般基础大模型建设包括自然语言基础大模型和视觉基础大模型。自然语言基础大模型覆盖政务、金融、法律、传媒、交通、信息技术、工程制造等领域的通用知识,并具备文本生成、问答、阅读理解等基础技能。视觉基础大模型具备图像分类、物体检测、实例分割、语义分割、姿态估计、目标跟踪、异常识别、视频分类的基础能力。通过基础大模型,结合行业专业知识和细分任务场景专有知识,支撑上层交通大模型和场景大模型。


交通大模型基于基础大模型,通过深度学习和模型训练,整合交通相关的专业知识如交通法规、交通报告、用户反馈、媒体评论等,以实现对交通行业知识的理解和任务的专业化处理。在交通行业大模型具备的专业知识基础上,基于特定业务场景的专有任务和数据需求,通过深度调优训练得到场景模型。基于场景模型,聚焦对专项任务的赋能支撑,如交通运行监测、应急保障、养护科学决策、经营分析、道路养护、桥隧养护、办公OA、报告写作等。


北京交科公路勘察设计研究院有限公司信息化分院高级工程师李照彬[1]表示,大模型核心要素包括算力、算法、数据,在构建过程中需要考虑数据集建设、模型训练、知识库建设、意图中控等。


算力部署。大模型的训练和推理需要强大的算力支持。目前,算力分为训练算力和推理算力,训练算力需求高,推理算力门槛较低。企业可根据需求通过云端或本地部署大模型,云端部署虽便捷但存在数据安全问题,而本地部署虽成本高但能提供更好的定制化能力。


数据集建设。数据是大模型效果的基础,典型的数据集建设流程包括数据采集与清洗,脱敏、去重、纠错、格式统一;数据加工标注通过人工或半自动方式形成标签数据、QA数据、COT数据,采用多种方式扩充数据集规模和多样性,保障模型的通用泛化能力的同时提升模型的专业能力;数据持续优化,在使用过程中收集用户访问方式,持续更新,提高效果。


模型训练。模型训练分为多个阶段:预训练让模型掌握基础语言规律;继续预训练在交通领域数据上深化专业能力;监督微调(SFT)针对具体任务优化模型表现;强化学习(RL)通过奖励机制提升决策能力;指令微调则让模型精准响应用户命令。

110cf51c5e23fbdf8fe276688b226fe7.jpg


模型训练示意图


知识库建设。通过检索增强生成(RAG)技术,从外部知识库动态获取相关数据,增强生成结果的准确性和可溯源性,可减少大模型的“幻觉”问题。然而,知识库建设面临无法全面总结信息、数据质量要求高和需要大量数据审计的挑战,可通过优化提示词工程提升模型输出的准确性和实用性。


意图中控。对智能问答、数据查询、简报生成等不同需求的语义理解,将不同场景问题进行初步控制筛选,匹配不同任务流,实现意图驱动的动态响应,通过大模型实现精准解析与多轮对话管理,避免传统关键词检索的局限性;智能化任务编排结合语义搜索与API调用。实现“查询-决策-执行”闭环(如“检索库存→生成调拨指令→联动调度系统”)。


支撑软件。大模型构建还需要基础支撑工具。模型资源管理软件主要包括大模型开发平台门户、用户工作空间管理、用户空间资产管理及基础大模型调测等功能。API网管软件对外提供API服务,支持HTTP、HTTPS,websocket访问;支持API注册、授权、测试的全生命周期管理;支持API的监控统计和分析。模型数据处理软件专注于自然语言大模型训练所需语料的开发。向量化处理软件用于专注于增强自然语言大模型的搜索能力。意图中控软件主要用于通过对智能问答、智能问数、简报生成等不同需求的语义理解,将不同场景问题进行初步控制筛选,匹配不同任务流。


发展趋势

从 “智能化筑基期”到 “智能化跃升期”


2025年6月,中国公路学会与东南大学牵头联合编制的《公路行业人工智能技术发展路线图》[2](以下简称《路线图》)正式发布,明确指出了公路行业AI大模型的发展趋势与路线。


《路线图》指出,公路行业AI大模型发展趋势包括S0:传统 AI 阶段(对应OpenAI早期单一任务模型阶段);S1:大语言模型阶段(对应OpenAI L1:Chatbot);S2:多模态智能体+具身智能阶段(对应 OpenAI L2:Reasoner+L3: Agent阶段);S3:通用人工智能(AGI)阶段(对应 OpenAI L4:Innovator+L5:Or ganizer阶段)。


公路行业形成涵盖大语言模型、多模态大模型、具身智能+多模态模型的AI大模型技术图谱。《路线图》中认为,大语言模型近期成熟度“中”,已落地政务智能化、规划设计优化等领域,中期及远期成熟度“高”,其高效推理技术可优化路口通行效率。多模态大模型近期成熟度“低”,中期“中”,远期“高”,在复杂系统协同与全生命周期管理中潜力大,如助力交通基础设施智慧养护。具身智能+多模态模型处于探索期,近期和中期成熟度“低”,远期“中”,在物理世界交互、全域感知仿真中具前瞻性,有望支撑全域路网运行监测。

85b0427f125aac2cd0b1004a8a1cba0e.png

图片来源:《公路行业人工智能技术发展路线图》


《路线图》还指出,公路行业 AI 大模型技术路线图,未来十年将分为 “智能化筑基期”(0~5年)与 “智能化跃升期”(5~10年)。



总体来看,尽管面临数据孤岛、算力瓶颈、行业标准不统一等现实挑战,2025年的交通大模型发展依然展现出创新活力。值得注意的是,大模型不是替代人类的“黑科技”,而是赋能行业的“新工具”。未来需要进一步明确哪些应用场景可以通过大模型实现优化和创新,哪些通过轻量化部署就可以解决关键问题,从而更好地利用大模型技术赋能交通运输未来发展。



*文章来源于中国交通信息化