摘要: https://tianchi.aliyun.com/forum/post/336310 由于标注数据通常是在word级别进行标注的,既然word还会被切分成subtokens,那么意味着a56爆大奖在线娱乐们还需要对标注数据进行subtokens的对齐。同时,由于预训练模型输入格式的要求,往往还需要加上一些特殊符号 阅读全文
posted @ 2023-04-17 14:25 morein2008 阅读(24) 评论(0) 推荐(0) 编辑