关于我
我是北京大学信息科学技术学院2023级智班的本科三年级学生。
我当前主要关注大语言模型、多模态大模型相关的研究,希望能探索关于大语言模型和多模态大模型的任何问题。
项目
my-tensor: 一个使用 C++ 和 CUDA 实现的轻量级深度学习框架,支持卷积神经网络,并在 MNIST 等数据集上进行了验证。该项目共包含 11,612 行 C++ 与 CUDA 代码。
llm-evaluator: 一个用于评估大语言模型(LLM)的综合性框架,支持安全性、能力以及拒答行为的评估,实现模型安全攻击与防御的统一评测。该项目共包含 5,068 行 Python 代码。
unify-llm: 一个统一的大语言模型推理框架,支持多种推理后端(API、Hugging Face、vLLM 等),并提供带缓存管理功能的统一接口。该项目共包含 2,849 行 Python 代码。
奖项
- 2023年第⼗五届全国⼤学⽣数学竞赛(⾮数学A类)⼀等奖
- 2023⾄2024学年国家奖学⾦
- 2024至2025年“智班”奖学金
