LOADING
基于百度文心大模型推出的创新搜索产品.
C-Eval 是一个全面的中文基础模型评估套件。
PubMedQA是一个用于生物医学研究问题回答的数据集。
OpenCompass是上海人工智能实验室开源的大模型评测平台。
SuperCLUE是中文通用大模型综合性评测基准。