智能农业场景
面向作物高产、资源高效利用与精准管理需求,利用物联网传感、AI算法、无人机遥感及5G边缘计算技术,构建农田/土壤/动植物生理自适应感知、病虫害识别预测、无人机植保、农业物联网监测、农业知识智能问答、大田作物/蔬菜全程无人化作业、设施农业智能管控、畜禽智能化养殖与行为监测、农产品智能分级、网约农机社会化服务等场景。
智能金融场景
面向快速信贷审批、个性化财富管理、实时金融风控等需求,利用云计算、机器学习、人工智能、区块链、大数据分析等技术,构建信创原生容器云平台、智能防干扰柜台对讲系统、虚拟电子货币、企业智能征信、智能辅助审核、智能金融客服、智能信贷、移动支付、智能推荐、自动化理财、智能投顾、实时反欺诈等场景。
智能港口场景
面向港口大型码头泊位、岸桥管理以及堆场、配载调度等应用需求,利用大数据与人工智能、云计算与边缘计算、区块链、数字孪生与仿真、绿色能源与低碳、无人驾驶等技术,构建智能码头机械化、数字孪生集成、生产时空管控、船舶自动配载、自动作业路径规划、集装箱管理及泊位优化、水平运输车辆、港口无人驾驶运输等场景。
智能矿山场景
面向安全生产、高效开采、资源优化利用、环境保护与智能管控、井工矿和露天矿智能化挖掘等应用需求,运用人工智能、新型地下移动无人平台系统、5G通信、基础软件、物联网感知、大数据分析、人工智能、云计算、数字孪生等新一代自主可控信息技术,建成矿山“数字网联、无人操作、智能巡视、远程干预”的常态化运行采掘等场景。
智能算力场景
面向智能体快速构建、AI应用高效开发、高效数据处理、行业内容创作、数据处理与分析、复杂模型训练、实时智能分析、智能决策支持等需求,利用高性能计算、云计算、边缘计算等技术,构建科学研究、金融科技、文化创意、教育培训、公共服务、工业制造、能源环境、智能数据中心、分布式训练平台、实时分析系统等场景。 赛题方向: 赛题一: 面向国产算力生态的知识发掘与应用 聚焦人工智能、复杂知识、算子优化、创新应用四大核心方向,探索新型的AI优化方法,提升国产算力平台的计算效率,并挖掘复杂系统中的知识结构,推动智能认知与决策。参赛者可以从以下几个方面展开研究和实践: 算子优化:针对国产AI芯片(如天数等),优化深度学习算子,提高模型计算效率,降低能耗,实现更高效的算力利用。 复杂知识挖掘:结合知识图谱、自然语言处理等技术,分析和挖掘国产GPU生态中的多源异构数据,构建面向开发者的知识体系。 创新应用探索:基于国产算力生态,开发适配于智慧城市、智能制造、医疗健康等领域的AI应用,提升国产AI技术的落地能力。 赛题二: 混合异构算力环境智能运维解决方案 针对现代智算中心混合异构计算环境(如CPU、GPU、NPU等)的运维挑战,通过设计智能运维框架,并利用大数据分析和机器学习技术进行故障模式识别、系统性能优化,提高智能运维系统的准确性和可靠性。解决方案需整合多源异构数据,实现对计算资源的统一监控、分析与管理,包括系统监控可视化、故障预测预警、资源动态调度等核心功能。参赛团队需构建能适应不同规模和配置环境的解决方案,达成对混合算力环境的全面运维管理、故障自动诊断和资源利用率优化,有效降低运维成本,提升系统整体可靠性。 赛题三: 面向Text2SQL场景能力进行微调挑战 针对在线算力应用场景,使用组委会提供的基础数据集,基于九章云极Alaya NeW在线算力平台提供的VSCode工具和算力包(GPU算力资源)完成对Llama3-8B模型的代码开发和模型微调,提升其Text2SQL能力。需要参赛选手在25 DCU(1 DCU =312 TFLOPS * 1小时)算力消耗完之前,完成最佳效果的模型微调和提交。允许自行调研更多的数据集、微调算法和代码,来提升微调的效果。 赛题四: 检索增强生成(RAG)召回命中率提升挑战 通过多种策略,如优化检索算法、文档格式自动转换,以及融合多种检索策略等方式,提高 RAG 系统在各类应用场景中的性能表现。参赛团队需要提出一套提升 RAG 命中召回率的解决方案。开发一个基于上述解决方案的 RAG 系统平台,并在多个标准数据集、复杂的文档类型情况下(扫描的PDF文件等)、在实际应用场景中进行测试,提供测试方案和测试数据,与主流开源的RAG系统进行对比验证,证明方案的可行性和先进性。实际应用场景应包含知识图谱问答、故障分析系统等。 赛题五: 创新代码生成与辅助技术AI编程工具 针对AI代码生成与编程辅助需求,利用开源DeepSeek模型的代码理解与生成能力,结合平台API扩展功能(如代码分析、调试接口),开发插件或独立应用,解决以下任⼀技术难题: Code RAG:针对大量外部信息,实现基于代码检索信息并增强生成效果(如根据代码反查数据库匹信息以提升代码生成效果)。 文档辅助编程:将技术文档自动转化为可执⾏代码(如API借口生成、代码方法效果提升等); 超大规模代码仓库的代码生成:支持千万级代码仓库的上细纹理解与生成。 Coding Agent拓展:基于MCP协议或者其他Agent框架实现动态的Agent。 赛题六: 基于多模态AI Agent的教育科研智能助手平台 针对教育科研领域科学研究过程中数据检索、整理、分析和内容生成等环节的工作效率与研究质量提升需求。基于多模态开源大模型,结合AI Agents技术,设计和实现一个适合科研人员的智能助手平台或工具链。实现智能文献检索与摘要生成能力;多模态科研数据的智能分析(文本、图表、视频、语音);具备多Agent协作,实现科研任务的自动分解与执行;提供科研内容自动生成(如研究报告、PPT、数据可视化等)。 赛题七: 智能数字教师培训内容生成与交互优化方案 针对数字化和智能化教学中培训老师需要快速、高质量地生成教学内容并高效地与学员互动等需求,利用大模型(如Llama3、DeepSeek、Qwen等)和异构算力环境(CPU/GPU/NPU),设计一个智能化的教师培训内容生成与互动系统,具备智能课件生成、互动问答助理、多模态内容融合、反馈优化机制等能力,帮助数字培训教师实现智能化自动生成教学课件(PPT)、讲义、微课视频、测验题目;实时分析和响应课堂互动数据,提供即时问答和个性化教学建议;可视化教学内容生成流程与互动效果评估分析。 赛题八: 基于多模态大模型的通⽤AI Agent平台 针对开源多模态大模型的通用AI Agent构建需求,实现基于多模态大模型的通用AI Agent平台或工具链。支持可视化将复杂需求拆解为可执行的子任务链;集成多种扩展能力(如多Agent协作、浏览器自动化操作、MCP协议跨平台通信等);实现与虚拟/物理环境的动态交互(如网页操作、数据库读写);具备对特定场景的定制支持能力。需提交完整的平台架构设计文档,包括:通信协议支持(如MCP协议扩展),任务调度机制(如多Agent协作策略),容错处理方案(如任务失败回滚机制),开放接口支持。 赛题九: 基于全国产大模型的情知兼具虚拟数字人 基于国产大模型,构建情知兼具虚拟数字人相关软件、系统、平台或工具。参赛者可以从以下几个方面展开研究和实践: 数字人知识库:结合知识图谱与大语言模型(LLM),构建虚拟数字人的动态知识库,使其在垂直领域(如医疗咨询、金融客服)中实现精准、可解释的问答与决策支持。 数字人情感化行为:开发具有情感表达能力的虚拟数字人行为生成系统,精准识别喜、怒、哀、乐、惊、惧及中性七种基础情感,并覆盖微表情、肢体语言与语调的智能适配,提升人机交互自然度。 国产化生态适配:基于国产算力硬件,开发可快速部署的虚拟数字人解决方案,重点突破智慧政务、在线教育等场景中的技术卡点。 赛题十: 工业大模型多模态训练数据集构建与质量优化方案 针对工业场景下大模型应用的特殊需求,设计一套高效的多模态数据处理与数据集构建方案。参赛团队需重点解决以下挑战:一是工业文本数据的专业术语识别、关键信息提取和指令数据生成;二是工业图像和视频的场景分类、目标检测与描述生成;三是多模态数据的关联与对齐,建立文本-图像-视频的语义连接;四是构建符合工业场景特点的偏好数据集,设计合理的评分标准与收集机制;五是评估数据集的构建与验证方法,确保模型在工业专业能力方面的可靠评估。
智能语言大模型场景
面向提升自然语言处理效率、满足多样化语言交互,以及智能客服、内容创作、语言翻译、知识问答等需求,利用深度学习和自然语言处理、大规模语料库等技术,构建智能对话系统、文本生成平台、实时翻译工具、智能问答等,能够理解和生成语言,与人类进行自然流畅的对话,提供有意义的回答或建议等广泛应用场景。