/ qwencoder-eval / instruct / evaluate.sh
evaluate.sh
 1  MODEL_DIR=${1}
 2  OUTPUT_DIR=${2}
 3  TP=${3}
 4  MODEL_DIR=${MODEL_DIR:-"./pretrained_models/"}
 5  OUTPUT_DIR=${OUTPUT_DIR:-"./results/"}
 6  mkdir -p ${OUTPUT_DIR}
 7  mkdir -p ${OUTPUT_DIR}/evalplus
 8  mkdir -p ${OUTPUT_DIR}/livecodebench
 9  mkdir -p ${OUTPUT_DIR}/MultiPL-E
10  mkdir -p ${OUTPUT_DIR}/bigcodebench
11  TP=${TP:-2}
12  
13  ROOT_DIR="."
14  
15  cd ${ROOT_DIR}/eval-dev-quality
16  bash test.sh ${MODEL_DIR} ${TP} ${OUTPUT_DIR}/eval-dev-quality
17  
18  cd ${ROOT_DIR}/aider;
19  bash test.sh ${MODEL_DIR} ${TP} ${OUTPUT_DIR}/aider
20  
21  cd ${ROOT_DIR}/multipl_e/chat;
22  bash test.sh ${MODEL_DIR} ${TP} ${OUTPUT_DIR}/MultiPL-E
23  
24  cd ${ROOT_DIR}/eval_plus;
25  bash test.sh ${MODEL_DIR} ${TP} ${OUTPUT_DIR}/evalplus
26  
27  cd ${ROOT_DIR}/BigCodeBench;
28  bash test.sh ${MODEL_DIR} ${TP} ${OUTPUT_DIR}/bigcodebench
29  
30  cd ${ROOT_DIR}/cruxeval;
31  bash test.sh ${MODEL_DIR} ${TP} ${OUTPUT_DIR}/cruxeval
32  
33  cd ${ROOT_DIR}/livecode_bench;
34  bash test.sh ${MODEL_DIR} ${TP} ${OUTPUT_DIR}/livecodebench