huangyezhufeng

BERT 论文复现: 经验 & 教训

  •  
  •   huangyezhufeng · Nov 3, 2025 · 1991 views
    This topic created in 197 days ago, the information mentioned may be changed or developed.

    https://datahonor.com/blog/2025/11/02/bert/

    目录:

    关于我们做到了哪一步
    BERT 简介
    有趣的观察
        预训练过程的有趣现象
        数据非常非常重要
        从 Finetune 管窥预训练的威力
    错误与教训
        即使在极小数据集上也无法过拟合
        一次性预处理全量数据,CPU 加班,GPU 休假
        试图用临时手搓的玩意儿达到很好的性能
        workers 和 prefetch 因子设得过大导致 OOM
        没有优雅处理 DataLoader worker 的异常
        评估时使用了错误的 tokenizer
    最后
    
    2 replies    2025-11-03 11:39:15 +08:00
    dryadent
        1
    dryadent  
       Nov 3, 2025   ❤️ 1
    看错误和教训就知道是真正训练了的, [ workers 和 prefetch 因子设得过大导致 OOM] 这个是刚做的人经常会遇到的问题~
    huangyezhufeng
        2
    huangyezhufeng  
    OP
       Nov 3, 2025
    @dryadent 👍,确实是踩过坑才知道:D
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3129 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 12:45 · PVG 20:45 · LAX 05:45 · JFK 08:45
    ♥ Do have faith in what you're doing.