2025-03|高质量中文预训练模型集合
在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型(感谢分享资源的大佬),并将持续更新…
最新的模型汇总地址github: https://github.com/lonePatient/awesome-pretrained-chinese-nlp-models
Expand Table of Contents
更新日志
基础大模型
对话大模型
多模态对话大模型
大模型评估基准
在线体验大模型
开源模型库平台
开源数据集库
开源中文指令数据集
Other-Awesome
NLU系列
BERT
RoBERTa
ALBERT
NEZHA
XLNET
MacBERT
WoBERT
ELECTRA
ZEN
ERNIE
ERNIE3
RoFormer
StructBERT
Lattice-BERT
Mengzi-BERT
ChineseBERT
TaCL
MC-BERT
二郎神
PERT
MobileBERT
GAU-α
DeBE ...
Arxiv今日论文 | 2026-02-13
本篇博文主要内容为 2026-02-13 从Arxiv.org论文网站获取的最新论文列表,自动更新,按照NLP、CV、ML、AI、IR、MA六个大方向区分。
说明:每日论文数据从Arxiv.org获取,每天早上12:30左右定时自动更新。
提示: 当天未及时更新,有可能是Arxiv当日未有新的论文发布,也有可能是脚本出错。尽可能会在当天修复。
目录
概览
自然语言处理CL
多智能体系统MA
信息检索IR
人机交互HC
人工智能AI
机器学习LG
计算机视觉CV
概览 (2026-02-13)
今日共更新670篇论文,其中:
自然语言处理共119篇(Computation and Language (cs.CL))
人工智能共227篇(Artificial Intelligence (cs.AI))
计算机视觉共98篇(Computer Vision and Pattern Recognition (cs.CV))
机器学习共215篇(Machine Learning (cs.LG))
多智能体系统共11篇(Multiagent Systems (cs.MA))
信息检索共22 ...
SWE-Master:基于后训练的开源软件工程智能体框架
开源地址:https://github.com/RUCAIBox/SWE-Master
1. 背景与核心洞察 (The Core Insight)
软件工程智能体(SWE Agents)正从概念验证走向生产级应用,但开源社区面临一个根本性的工程瓶颈:缺乏透明且可复现的端到端训练流程。当前主流系统(如OpenAI的Codex、Anthropic的Claude Sonnet)的训练数据构造、强化学习策略及推理框架设计均处于黑盒状态,这导致学术界难以复现结果、验证假设或进行增量改进。
SWE-Master的核心洞察在于:通过系统性的后训练优化(Post-Training),即使从SWE能力极弱的开源基座模型(如Qwen2.5-Coder-32B在SWE-bench Verified上初始resolve rate低于10%)出发,也能通过精心设计的Data Curation → Long-Horizon SFT → RL with Real Execution → Test-Time Scaling流水线,激发出强大的长程软件工程任务解决能力。
该工作在AI技术栈中的定位是:首个完全开源、端 ...
Arxiv今日论文 | 2026-02-12
本篇博文主要内容为 2026-02-12 从Arxiv.org论文网站获取的最新论文列表,自动更新,按照NLP、CV、ML、AI、IR、MA六个大方向区分。
说明:每日论文数据从Arxiv.org获取,每天早上12:30左右定时自动更新。
提示: 当天未及时更新,有可能是Arxiv当日未有新的论文发布,也有可能是脚本出错。尽可能会在当天修复。
目录
概览
自然语言处理CL
多智能体系统MA
信息检索IR
人机交互HC
人工智能AI
机器学习LG
计算机视觉CV
概览 (2026-02-12)
今日共更新617篇论文,其中:
自然语言处理共86篇(Computation and Language (cs.CL))
人工智能共174篇(Artificial Intelligence (cs.AI))
计算机视觉共97篇(Computer Vision and Pattern Recognition (cs.CV))
机器学习共222篇(Machine Learning (cs.LG))
多智能体系统共11篇(Multiagent Systems (cs.MA))
信息检索共22篇 ...
Arxiv今日论文 | 2026-02-11
本篇博文主要内容为 2026-02-11 从Arxiv.org论文网站获取的最新论文列表,自动更新,按照NLP、CV、ML、AI、IR、MA六个大方向区分。
说明:每日论文数据从Arxiv.org获取,每天早上12:30左右定时自动更新。
提示: 当天未及时更新,有可能是Arxiv当日未有新的论文发布,也有可能是脚本出错。尽可能会在当天修复。
目录
概览
自然语言处理CL
多智能体系统MA
信息检索IR
人机交互HC
人工智能AI
机器学习LG
计算机视觉CV
概览 (2026-02-11)
今日共更新595篇论文,其中:
自然语言处理共84篇(Computation and Language (cs.CL))
人工智能共163篇(Artificial Intelligence (cs.AI))
计算机视觉共112篇(Computer Vision and Pattern Recognition (cs.CV))
机器学习共175篇(Machine Learning (cs.LG))
多智能体系统共9篇(Multiagent Systems (cs.MA))
信息检索共19篇 ...
Arxiv今日论文 | 2026-02-10
本篇博文主要内容为 2026-02-10 从Arxiv.org论文网站获取的最新论文列表,自动更新,按照NLP、CV、ML、AI、IR、MA六个大方向区分。
说明:每日论文数据从Arxiv.org获取,每天早上12:30左右定时自动更新。
提示: 当天未及时更新,有可能是Arxiv当日未有新的论文发布,也有可能是脚本出错。尽可能会在当天修复。
目录
概览
自然语言处理CL
多智能体系统MA
信息检索IR
人机交互HC
人工智能AI
机器学习LG
计算机视觉CV
概览 (2026-02-10)
今日共更新450篇论文,其中:
自然语言处理共63篇(Computation and Language (cs.CL))
人工智能共145篇(Artificial Intelligence (cs.AI))
计算机视觉共81篇(Computer Vision and Pattern Recognition (cs.CV))
机器学习共139篇(Machine Learning (cs.LG))
多智能体系统共9篇(Multiagent Systems (cs.MA))
信息检索共21篇( ...
Arxiv今日论文 | 2026-02-09
本篇博文主要内容为 2026-02-09 从Arxiv.org论文网站获取的最新论文列表,自动更新,按照NLP、CV、ML、AI、IR、MA六个大方向区分。
说明:每日论文数据从Arxiv.org获取,每天早上12:30左右定时自动更新。
提示: 当天未及时更新,有可能是Arxiv当日未有新的论文发布,也有可能是脚本出错。尽可能会在当天修复。
目录
概览
自然语言处理CL
人工智能AI
机器学习LG
计算机视觉CV
信息检索IR
多智能体系统MA
概览 (2026-02-09)
今日共更新533篇论文,其中:
自然语言处理共76篇(Computation and Language (cs.CL))
人工智能共146篇(Artificial Intelligence (cs.AI))
计算机视觉共98篇(Computer Vision and Pattern Recognition (cs.CV))
机器学习共190篇(Machine Learning (cs.LG))
多智能体系统共6篇(Multiagent Systems (cs.MA))
多智能体系统
[MA-0] I ...
how to build a prompt for anything (and remix them at will)
简介在 AI 开发领域,提示工程 (Prompt Engineering) 是优化大型语言模型 (LLM) 输出的关键技术。本文介绍一个高级提示模板。
关于"LLM 聊天中的 Prompt Engineering"和"Agentic Engineering 中的 Prompt Engineering",最终都归结为一个简单的系统。它在网上疯传——数十万次浏览,数千次收藏,很多人意识到他们一直在对着 AI 许愿,而不是在工程化行为或系统。
读完这篇文章,如果你愿意,你将不再需要复制粘贴任何人的 Prompt。你会想要构建自己的。
1. 停止复制粘贴 Prompt
互联网上充斥着"Top 50 ChatGPT Prompts"的帖子。人们收藏它们,粘贴进去,很多时候得到中等结果,然后继续寻找下一个。
问题出在这里:为一个特定使用场景、特定上下文、特定输出目标构建的 Prompt,永远不会比你自己构建的效果更好。而且这也不该由我来告诉你——这是你自己该搞清楚的。但我还是告诉你了,因为我爱你。
你现在做的事情就像戴别人的处方眼镜。技 ...
Arxiv今日论文 | 2026-02-06
本篇博文主要内容为 2026-02-06 从Arxiv.org论文网站获取的最新论文列表,自动更新,按照NLP、CV、ML、AI、IR、MA六个大方向区分。
说明:每日论文数据从Arxiv.org获取,每天早上12:30左右定时自动更新。
提示: 当天未及时更新,有可能是Arxiv当日未有新的论文发布,也有可能是脚本出错。尽可能会在当天修复。
目录
概览
自然语言处理CL
人工智能AI
机器学习LG
计算机视觉CV
信息检索IR
多智能体系统MA
概览 (2026-02-06)
今日共更新697篇论文,其中:
自然语言处理共101篇(Computation and Language (cs.CL))
人工智能共220篇(Artificial Intelligence (cs.AI))
计算机视觉共129篇(Computer Vision and Pattern Recognition (cs.CV))
机器学习共253篇(Machine Learning (cs.LG))
多智能体系统共10篇(Multiagent Systems (cs.MA))
多智能体系统
[MA-0 ...
Arxiv今日论文 | 2026-02-05
本篇博文主要内容为 2026-02-05 从Arxiv.org论文网站获取的最新论文列表,自动更新,按照NLP、CV、ML、AI、IR、MA六个大方向区分。
说明:每日论文数据从Arxiv.org获取,每天早上12:30左右定时自动更新。
提示: 当天未及时更新,有可能是Arxiv当日未有新的论文发布,也有可能是脚本出错。尽可能会在当天修复。
目录
概览
自然语言处理CL
人工智能AI
机器学习LG
计算机视觉CV
信息检索IR
多智能体系统MA
概览 (2026-02-05)
今日共更新612篇论文,其中:
自然语言处理共102篇(Computation and Language (cs.CL))
人工智能共169篇(Artificial Intelligence (cs.AI))
计算机视觉共115篇(Computer Vision and Pattern Recognition (cs.CV))
机器学习共224篇(Machine Learning (cs.LG))
多智能体系统共12篇(Multiagent Systems (cs.MA))
多智能体系统
[MA-0 ...



