年月中旬百度岗位面试题分享二
问题6:NLG的评估指标有哪些 BLEU (Bilingual Evaluation Understudy) ROUGE (Recall Oriented Understudy for Gisting Evaluation) BLEU是机器翻译中使用最广泛的评估指标,可以看成是精确率,公式如下: ROUGE可以看作是召回率,有以下几种: ROUGE-N:计算 n-gram 的召回率,即算出候选译文和参考译文重合的 n-gram 个数占参考译文的比例; ROUGE-L:计算最长公共子序……