��ģ�ͷ��ƽ̨��֮ģ��ѵ��ʵ��|��Χ��~-��ƿ��

2024��1�£��֪��ֱ��У��-��ʵ��-��͡��˴�ģ�ͷ��ƽ̨��ģ��ѵ��ŵ�ʵ��ֱ��зֱ��ģ��ѵ��

1.��һվʽȫ��·ģ��ѵ��ı��״

2.��ģ��ѵ��뷽��

3.��ģ��ѵ��ȫ��̺�badcase��

��ͨ��ۿ��·��Ƶ��һ��̽��ģ��ѵ��İ��ذ�?~

��

С��ֱ��ᵽ��⼰�ش��鿴�·��˽�Ŷ?

1��û�а�ȫ��Ĵ�ֱģ�ͣ�

��Ŀǰû�а�ȫ��Ĵ�ֱģ�ͣ��ȼ��붤��Ⱥ��65295003032��ע��Ʒ��̬��

2��մʵ��Ϊѵ��

�𣺿��Եģ��ͨ��ϴ�ѵ��ʱ��ָ��ݼ��𰸣��ģ��ѧϰ��

3��Ŀǰ��ư��ֻ��ѵ��ͼƬ��ѵ��

��Ŀǰ�Ƚϲ��ѵ��ģ̬��ģ�ͱȽϾ۽��Գ��ע��

4��ͨ��ǧ��ģ��ܲ��ֻ��ѵ��

�𣺿��Եģ�Ŀǰ��ѵ��ǵ��ģ�飬��ֻʹ��

5��ʹ�ø߽�ģ��΢��ͽ�ģ��³��

��Ӧ��֪ʶ��ü��ͨ��΢��߽�ģ�ͻ�ȡǿ��֪ʶ��Ȼ��ת��ͽ�ģ�ͣ�ʵ��ģ��ѹ��Ż��ʹ�õͽ�ģ��ڱ��С�ɡ��Ч��ͬʱ��ýӽ��Խ�߽�ģ�͵��ܡ�

6��ν��ģ�Ͳ��ô�洢�ģ�

�𣺿��ͨ��ħ��ģ�ͣ��ģ�ͽṹ��json��Բο�json��ݡ�һ��ÿ�Դ��Python��ȥ��Ϣ��е��Ѷȡ��ǿ��˽�洢��̡�

7��һ��Ҫ��ѧ��Ӧ�ã��Ҫʲô��ģ�ͣ�

�𣺿��Գ��ʹ��ǧ��ģ�ͣ��ڲ�ͬ��п�Դ�˲��ģ�ͣ��codeָ��Ǳ�̵ķ��򣬿��ȥ�˽��Ƿ��ܽ��⡣

8��ʲôָ��ģ��Ч��

��ֱ�۵ķ�ʽ��ִ�д��롣��Ҫдһ�±��֤��

9��ݼ��Ķ��ô��壿

��ݼ��Ķ��ָ��⡢�ı��͡�д��Ա��塢��߱��ʱ��ȵȶ��ά��ֳ��ķḻ�̶ȺͲ��ԣ�ּ��ʵ��ӳ��Ե�ʵ��ʹ��NLPģ�͵ķ��ͶԶ�ԪӦ�ó��Ӧ�ԡ�

10��û�а취��tokens�ĳ��ȣ�

��һ��ģ�ͳ��ȥ��Ļ��Ѷȡ�

11��ʹ�ô�ģ��ʱ��qwen-turbo��qwen-maxӦ��ôѡ��

��qwen-turboע��ٶ��ԴЧ�ʣ��ʺ϶��Ӧ�ٶȺͲ��нϸ�Ҫ��ĳ��qwen-max��۽��ȫ��֪ʶ��ڶ�ģ�;��Ⱥʹ��ϸ�Ҫ��Ļ��qwen-turbo�ķ��Ҫ��qwen-max�͡��ľ��Ȩ�⣬ѡ��ʺ��Լ��ģ�Ͱ汾��Ҳ��Բ鿴ģ�ͽ��ܣ�https://help.aliyun.com/document_detail/2713153.html�˽��졣

12��ģ��ѵ��е��Զ��ģ��ô�ϴ��

��ģ�͵��е��Զ��ģ��ָ��ѵ��ɵ�ģ�ͣ��Ҫ��ѵ��ʱ��ѡ��Զ��ģ�͡��Լ��ڱ��ѵ��ģ�Ͳ�֧��ϴ��

13��ģ�͵��֪ʶ��΢��Ԥѵ��ѧ��ģ�

��ͨ��Ԥѵ��ģ�΢��С��֡�

14��ѵ��Ŀ�Դģ��Ƿ�֧�ֵ��

��Ŀǰ��֧�֡�

ģ��ѵ��ָ��

ͨ��Ƶѧϰ��ģ�͵��ŵĸ��ʹ��˵��ʵ��ָ��ǵ�¼��ư��̨��С��ţ��һ�£�

һ��ģ�͵��ĸ��Ҫ��̣��

��׼��ʺ�ѵ��ѵ��ݼ��һ��ʴ�Pair��ϣ��ڲ�ͬ��в�ͬ�ĳ��̬��
ģ�͵��ţ�ͨ��ѡ��ʵ��ݼ��ѵ��ض��ģ��ģ��Ч��ͨ��ѵ��/��ָ��ж�ѵ��Ч��
ģ�Ͳ��ѵ��õ�ģ��Ҫ��󷽿��ṩ��⡢Ӧ�õ��þ��Ȳ��ģ�ͣ��
ģ��⣺��ʵ��ݼ��Ѿ�ѵ��õ�ģ�ͽ��⣬ͨ��ϵͳ��д�ֻ��ע��֤ģ�͵��ŵ�Ч��

��һ��׼��

�ҵ�ģ�͹��ߣ�ѡ��ѵ��ݣ��ϴ��ݼ��ģ�壨��ݼ�ģ��/��⼯ģ�壩��ϴ��ݣ��ɡ��ϴ��ɺ��б��в鿴��Ӧ��ݣ��ģ��ѵ��

��⼯ѡ��ϴ��ݼ��ʾ��ݣ��ɡ��ϴ��⼯֧�ֲ鿴��ء�ɾ��

�ڶ��ģ�͵��

��ѵ��ģ��

��ģ�͵��š�ģ�飬ѡ��ѵ��ģ�͡��ʾ��д��̵�רҵ��ʿɲ鿴��ѧϰ��

ѡ��ģ�Ͱ汾

Ŀǰ֧��Ԥ��ģ�����Զ��ģ����״��ģ��ѵ��ʱ�޿�ѡ�Զ��ģ�͡�

��ѡ��ģ��tips��

΢��ѵ��ģ�Ϳ��֧��ҵ�Զ��ѵ��ݣ��ģ�͵�΢��ѵ��΢��ѵ��Ӱ��ģ�͵�Ч��ѡ��ʵ��ݽ�ʹ��ģ��Ч��ҵ��ҵ��ҵ��ѡ��ҵר��ģ�͵Ļ��߰汾��΢��Ҳ��ѡ��΢��ģ�Ͱ汾�Ͻ��н�һ��΢��

ѡ��ģ��

��ѡ��ݼ���ղ��ת��ѵ����ҳ��ϴ��ݣ��40��ݡ�֧��xls��xlsl��ʽ��ģ��ϴ��

ע����ѡ��ʵ�ѵ��ݽ��΢��ѵ��ѵ��Ҫ��ռȶ��ĸ�ʽ�� Prompt / Completion�ԣ� ��ϸ��ʽ��ʽ�ο��example.excelѵ��֧�ֱ��ϴ��ѡ��ѵ��е��ݣ��˴��ϴ��ѵ��ͬʱ��ѵ��С�

��ѵ��

ͨ�û��ѵ��֧��û��ѵ��ǧ�ʻ��ģ��ͨ�ö��򡢶��ҵ��ೡ��ݻ�ϣ��ѵ��Ӷ��ѵ��Ч��ģ��ʧ��ע�⣬ѡ��ѵ��󣬻�ϲ��ݽ��ѵ��Token��У�һ��Ʒѣ�ƽ̨֧��ѡ��ѵ��ݽ��л��ѵ��

ʾ��-�Ի� 1.1�� >> ��ѵ��ݣ��ģ��ĶԻ��1:1.1�ı��ѵ��

ʾ��-��ѧ 0.5�� >> ��ѵ��ݣ��ģ��ѧ��1:0.5�ı��ѵ��

��

��ҵ��ͨ��Ӱ��ģ�͵��ŵĹ��̣��Ӷ�Ӱ��ģ�͵��ŵ�Ч��ͬ�Ĳ��ѵ��Ľ��ͬ��һ�㽨��ʹ��Ĭ��á�

�Զ��ʽ��Ͳο���

��ʼѵ��

Ԥ��ѵ��ã�׼��ʼѵ��ʼѵ��У��ģ�͹��б�ˢ��״̬��ͬʱ��ɲ鿴ѵ��е��ָ�꣬ѵ��ͨ��֪ͨ��

��Ҫ

ģ�͵��Ž��ѵ��ã�ѵ��۸� 0.1Ԫ/ǧtokens ��鿴��Ʒ�Ʒ��

��㹫ʽ��

�Ʒ�token��= ѵ��token�� * ѭ��

ģ�͵��ſ�ʼ�󣬾ͻ��ã�ѵ��ʧ�ܳ��⣩��

ģ��б�

��ѵ��ʱ��Բ��鿴��ֹѵ��ѵ��ɺ󣬿ɲ��ɾ��ѵ��

�鿴��Բ鿴��ѵ��е�ģ��Ϣ��Ҳ��ҳ��е����ʼ���� Traning loss��Validation Loss��Validation Token Accuracy ��ʽ��뻬��·��鿴��Ե��ֹѵ��ˢ��ѵ��չ��

��ֹѵ����ֹͣѵ��״̬Ϊ��ֹѵ��

ɾ����ɾ��ģ�ͽ��ڣ��

ģ�Ͳ����ģ�Ͳ��󣬵��ʼ��ģ�Ͳ��ģ�Ͳ��в鿴��

ע�⣺��ģ�ͽ��ģ�Ͳ��ã��۸���Ʒ�Ʒ���ģ�Ϳ�ʼ��󣬾ͻ��ã��ʧ�ܳ��⣩��

��ģ�Ͳ��

ע�⣺��ģ�ͽ��ģ�Ͳ��ã��۸��鿴��Ʒ�Ʒ��ģ�Ͳ��ɹ��ϵͳ��ʼ�Ʒѣ��ֶ��ߺ�ģ�ͽ��ټƷѣ��ʧ�ܳ��⣩��ͬ״̬�¼Ʒ��߼��ο��ı��

·��ģ��-ģ�Ͳ��-��ģ��

��ģ�͡��--ѡ��ʵ�ģ�ͽ��в��

�Զ��ģ�ͣ��û��Լ��SFTѵ��õ��ģ�ͣ��ṩģ�ͷ��״β��û�п�ѡ�Զ��ģ�͡�
Ԥ��ģ�ͣ�δ��ѵ��ϵͳ�ṩ��Ԥ�û��ģ�ͣ�ֱ�Ӳ��ģ��ṩ��

��һ��ѡ��Ӧ��Դ��

��Դ��ѡ��ѹ��İ��Ԥ��Դ�飬��ͬ��ģ��Ҫ��Դ��ͬ��ѡ��ģ�ͺ�ϵͳ��Զ�ɸѡ��Ҫ��Դ��ͣ�Ԥ��Դ��Լ۱ȸ��
��ѣ�ѡ��󸶷ѵ�ģʽ��ɲ��ϵͳ��ڲ��ɹ��ʼ�Ʒѣ��ģʽ��Ӷ�̬��޵��ʱ�䣬��ʱ��ߡ�

��ʼ��𡿵ȴ�״̬��Ϊ��ɹ��

ϵͳ��֪��ķ��ã��ȷ�Ϻ�ϵͳ��ʼ��𣬲��ɹ��ʼ�շ�

��ɺ�ģ��̬��Ϊ��У��Բ��鿴��ݡ��ߡ��ʧ��֧��²��𣬸��˵��£�

�鿴��鿴ģ�Ͳ��飬��Դ��ģ��͵ȡ�
��²��𣺲��ʧ�ܺ󣬿ɵ��²��ɲ��
��ݣ��Դ��ã��Դ��Դ��ɹ��ϵͳ��ʵ��ʹ�õ��Դ�Ʒѡ�
��ߣ��ɽ��е��ߣ��ߺ��񽫻��Զ�ɾ��
ɾ��ʧ�ܡ�Ƿ��ߺ󣬿�ɾ��ģ�ͣ�ɾ��ټƷѡ�

״̬	��	�Ʒ��
��	�鿴	��״̬��Ʒ�
��	�鿴��ݡ��	��״̬��Ʒѣ��ߺ��ʧ��ֹͣ�Ʒ�
Ƿ��ͣ��	�鿴��ɾ��	��״̬��Ʒѣ�Ƿ��״̬��Ʒѣ��ֵ��ģ�ͽ��ָ��Զ��ָ��󽫿�ʼ�Ʒѣ��ɾ��ʧ��ټƷ�
Ƿ�ѻָ��	�鿴	��״̬��Ʒѣ��ʾ�˻��ѳ�ֵ��ϵͳ�Զ��ָ��У��ָ��״̬�任Ϊ��н��ָ��Ʒ�
��ʧ��	�鿴��ɾ��²��	��״̬��Ʒѣ��²��ɹ��Ϊ��״̬��мƷѣ��ɾ��ʧ��ټƷ�

��Ĳ��ģ��

ͨ��ģ��⣬��ѵ��ģ��Ƿ��ܹ��Լ��Ľ��

��ģ�Ͳ��ģ�͵�Ч��ģ��н��⣬ģ��Ҫ��ȹ��ݼ��ѵ��Ĺ��ݸ�ʽͬ��ʴ�Pair�ԣ��Prompt��Ҫ��֤��⣬��Completion��ο��Ĵ𰸣��ͨ��Ա�ģ�ͽ��ο��𰸣�ͬʱ�ۺϿ��ģ�ͽ��ȷ�ԣ��ģ�ͽ��д�ֻ��򣬵õ�ģ��ʵЧ��

ģ��ģʽ��£�

��ⷽʽ

��Ч��

��

��Ҫ��ⵥһģ�͵�Ч��ѡ��⼯��ƽ̨��Զ��⼯�е�PromptԤ��ģ�ͽ��ͬʱչʾ��⼯��Ԥ�õ��Ϊ�ο��ģ��Ԥ��д�ֺ󣬿��ж�ģ��Ч��

�Ա��

�Ա��Ҫ��ģ�͵�Ч��ѡ��⼯��ƽ̨��Զ��⼯�е�PromptԤ��ÿ��ģ�͵Ľ��ͬʱչʾ��⼯��Ԥ�õ��Ϊ�ο��Ա��֧��ÿ��ģ�ͽ��д�֣�ͬʱ֧��ģ��ͨ��жϲ�ͬģ��֮��Ч��

ע�⣬��ڶԱ��ԣ��жԱȵ�ÿ��΢��ģ�;��𷽿ɽ��⣬��Ի��ģ�͵��⽫��token��÷��ã��Ʒ�۸��顣

һ��ѵ��˵��ģ�͵��£��ǻ��е��⣬��ѵ��˶��ģ�ͣ�ϣ��ԱȲ�ͬģ�͵�Ч��ѡ��Ա��ģʽ��⡣

��ʾ��

·��ģ�͹��--ģ��--��

ѡ��ⷽʽ��ҳ��Ϸ��в�ͬ��ⷽʽ��ܣ��ѡ�񣬽��ѡ�񵥸��⡣

��ʼ�󣬵��⣬��ж��ݽ��д�ꡣ

��ɺ��Ե��ز鿴��

ģ��ģ�ͷ��÷��ã�ÿ��ģ�;��мƷѣ��Ʒ��߼��ģ��һ�£��token��мƷѡ�

��Ͼ��ģ�͵��&��𲢲��ȫ��~ ��Ƿ��ʲô��Ҫ��ǽ�𣿻�ӭ��̽�֣�

��ģ�ͷ��ƽ̨��֮ģ��ѵ��ʵ��|��Χ��~

��