关于我

English

我是北京大学信息科学技术学院2023级智班的本科三年级学生。

我当前主要关注大语言模型、多模态大模型相关的研究,希望能探索关于大语言模型和多模态大模型的任何问题。

项目

  • my-tensor: 一个使用 C++ 和 CUDA 实现的轻量级深度学习框架,支持卷积神经网络,并在 MNIST 等数据集上进行了验证。该项目共包含 11,612 行 C++ 与 CUDA 代码

  • llm-evaluator: 一个用于评估大语言模型(LLM)的综合性框架,支持安全性、能力以及拒答行为的评估,实现模型安全攻击与防御的统一评测。该项目共包含 5,068 行 Python 代码

  • unify-llm: 一个统一的大语言模型推理框架,支持多种推理后端(API、Hugging Face、vLLM 等),并提供带缓存管理功能的统一接口。该项目共包含 2,849 行 Python 代码

奖项

  • 2023年第⼗五届全国⼤学⽣数学竞赛(⾮数学A类)⼀等奖
  • 2023⾄2024学年国家奖学⾦
  • 2024至2025年“智班”奖学金