本文来自“人工智能行业数据集构建及模型训练方法实践”,在当前大模型时代,行业模型在推动智能化转型和创新发展中发挥着至关重要的作用,而高质量的行业数据是提升大模型性能和实现行业应用落地的关键。
数据为模型服务,模型由开发者实现。从海量的数据中筛选出各个语种,各个行业的数据,是一项繁重且高价值工作,主要涉及3个核心内容:语种划分,行业分类,质量评估。
1、AI算力“卖水人”系列(1):2024年互联网AI开支持续提升
2、AI算力“卖水人”系列(2):芯片散热从风冷到液冷,AI驱动产业革新3、AI算力“卖水人”系列(3):NVIDIA GB200:重塑服务器、铜缆、液冷、HBM分析1、中伦互联网数据中心全解读
2、中国第三方数据中心服务商分析报告
3、面向AI 智算数据中心网络架构与连接技术的发展路线展望
4、新一代智算数据中心基础设施技术白皮书
5、中国数据中心产业发展白皮书1、大语言模型在计算机视觉领域的应用
2、大模型的异构计算和加速
3、大模型辅助需求代码开发
4、大模型在华为推荐场景中的探索和应用
5、大模型在推荐系统中的落地实践
6、大语言模型的幻觉检测
7、大语言模型在法律领域的应用探索1、长文本大模型推理实践:以 KVCache为中心的分离式推理架构
2、全方位评测神经网络模型的基础能力4、书生万象大模型的技术演进与应用探索
5、提升大模型知识密度,做高效的终端智能
6、向量化与文档解析技术加速大模型RAG应用落地
7、小米大模型端侧部署落地探索-黄武伟
8、语言模型驱动的软件工具思考:可解释与可溯源1、全方位评测神经网络模型的基础能力
2、电商大模型及搜索应用实践 翟周伟
3、多环境下的LLM Agent应用与增强
4、非Transformer架构的端侧大模型创新研究与应用
5、硅基流动高性能低成本的大模型推理云实践
6、基于大模型的缺陷静态检查
7、快手可图大模型的技术演进与应用探索
8、千亿参数 LLM 的训练效率优化1、AI系列深度报告(一):光模块AIGC高景气持续,800G+产品需求旺盛
2、AI系列深度报告(二):HBM高带宽特性释放AI硬件性能,AI高景气持续驱动需求高增
3、AI系列深度报告(三):政策与技术螺旋前进,高级别自动驾驶商业闭环雏形已现3D DRAM行业报告:3D DRAM时代或将到来,国产DRAM有望迎来变革契机2024年中国AI大模型场景探索及产业应用调研报告:大模型“引爆”行业新一轮变革光芯片研究报告:高速互联需求驱动光通信行业发展,国产光芯片有望加速渗透1、艾媒咨询:2024年中国信创产业发展白皮书(精简版)
2、艾媒咨询:2023年中国信创产业发展白皮书(精简版)1、2024大模型典型示范应用案例集
2、2023大模型落地应用案例集2024亚太不同国家和区域对生成式AI的反应白皮书计算机自主可控系列:国产AI算力万卡集群,多芯混合时代来临计算机行业深度:从技术路径,纵观国产大模型逆袭之路1、AI算力卖水人系列(1):2024年互联网AI开支持续提升
2、AI算力卖水人系列(2):芯片散热从风冷到液冷,AI驱动产业革新本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。