avatar

何洋的个人空间

  • Previous
  • Next

  • Article

    post_img

    动态规划之背包问题

    背包问题 01背包 每件物品最多用一次 思路: 先考虑朴素的二维实现,再可以使用“滚动数组”优化,转化位一维数组实现 空间从$N^2$变为$N$ 朴素版

    post_img

    使用TRL对LLM进行SFT微调

    实验目标 利用现有的语料数据,构造问答数据对(例如:提问:苹果是什么颜色?回答:是红色的。让模型补全“回答”后面的内容) 数据加载 对于许多的训练步骤,包

    m-avatar