இந்த தளத்தின் உள்ளடக்கம் செயற்கை நுண்ணறிவு (AI) அல்லது இயந்திர மொழிபெயர்ப்பு தொழில்நுட்பம் மூலம் மொழிபெயர்க்கப்பட்டுள்ளது; பிழைகள் இருக்கலாம்.

Skip to content
Artificial Intelligence
Programming Languages

செல்கோட்அலைன்: குறியீடு உருவாக்கத்திற்கான சுய சீரமைப்பு

Author

யுக்சியாங் வெய் (இல்லினாய்ஸ் அர்பானா-ஷாம்பெயின் பல்கலைக்கழகம்), ஃபெடரிகோ காசானோ (நார்த்ஈஸ்டர்ன் பல்கலைக்கழகம் மற்றும் கர்சர் ஏஐ), ஜியாவெய் லியு (இல்லினாய்ஸ் அர்பானா-ஷாம்பெயின் பல்கலைக்கழகம்), யிஃபெங் டிங் (இல்லினாய்ஸ் பல்கலைக்கழகம், அர்பானா-சாம்பெயின்), நமன் ஜைன் (கலிபோர்னியா பல்கலைக்கழகம், பெர்க்லி), சக்கரி முல்லர் (ஹக்கிங் ஃபேஸ்), ஹார்ம் டி வ்ரீஸ் (சர்வீஸ்நௌ), லியான்ட்ரோ வான் வெரா (ஹக்கிங் ஃபேஸ்), அர்ஜுன் குஹா (வடகிழக்கு பல்கலைக்கழகம் மற்றும் ராப்லாக்ஸ்), லிங்மிங் ஜாங் (இல்லினாய்ஸ் பல்கலைக்கழகம், அர்பானா-சாம்பெயின்)

Venue

நியூராலிப்ஸ் 2024

Abstract

உத்தரவுச் சீரமைப்பு என்பது ஒரு மேற்பார்வையிடப்பட்ட நுணுக்கமான சீரமைப்பு அணுகுமுறையாகும், இது பெரிய மொழி மாதிரிகள் (LLMs) மனித உத்தரவுகளைப் பின்பற்றும் திறனை கணிசமாக மேம்படுத்துகிறது. பரந்த அளவிலான மனிதக் குறிப்புகள் அல்லது சுருக்கம் இல்லாமல், குறியீட்டு மொழி மாடல்களை (LLMs) தன்னிச்சையாக சீரமைப்பதற்கான முதல் முழுமையான வெளிப்படையான மற்றும் அனுமதிக்கப்பட்ட குழாயான செல்கோட்அலைன் (SelfCodeAlign)-ஐ நாங்கள் முன்மொழிகிறோம். செல்கோட்அலைன் தரவு உருவாக்கும் செயல்முறை முழுவதும் பகுப்பாய்விற்காக ஒரே அடிப்படை மாதிரியைப் பயன்படுத்துகிறது. இது முதலில் உயர்தர விதைத் துணுக்குகளிலிருந்து பல்வேறு குறியீட்டுக் கருத்துக்களைப் பிரித்தெடுத்து புதிய பணிகளை உருவாக்குகிறது. பின்னர், ஒவ்வொரு பணிக்கான பல பதில்களை மாதிரியாக எடுத்து, ஒவ்வொன்றையும் சோதனை நிகழ்வுகளுடன் இணைத்து, ஒரு சாண்ட்பாக்ஸ் சூழலில் அவற்றைச் சரிபார்க்கிறது. இறுதியாக, அறிவுறுத்தல் பயிற்சிக்காக எடுத்துக்காட்டுகள் தேர்ந்தெடுக்கப்படுகின்றன. எங்கள் முதன்மைச் சோதனைகளில், 74k அறிவுறுத்தல்-பதிலாக்க ஜோடிகளைக் கொண்ட தரவுத்தொகுப்பை உருவாக்க, CodeQwen1.5-7B உடன் SelfCodeAlign-ஐப் பயன்படுத்துகிறோம். இந்தத் தரவுத்தொகுப்பில் நுணுக்கப் பயிற்சி செய்வது, HumanEval+-இல் 67.1 pass@1-ஐ அடையும் ஒரு மாதிரியை உருவாக்குகிறது. இது CodeLlama-70B-Instruct-ஐ விட பத்து மடங்கு சிறியதாக இருந்தாலும், அதை விஞ்சுகிறது. அனைத்து அளவுகோல்களிலும், இந்த நுணுக்கமாகப் பயிற்றுவிக்கப்பட்ட மாதிரி, மனிதக் குறிப்புகள் அல்லது சுருக்கம் இல்லாமல் அறிவுறுத்தல் சரிசெய்தலுக்கான முந்தைய அதிநவீன முறையான OctoPack கொண்டு பயிற்றுவிக்கப்பட்ட அசல் பதிப்பை விட தொடர்ந்து சிறப்பாகச் செயல்படுகிறது. கூடுதலாக, SelfCodeAlign ஆனது 3B முதல் 33B வரையிலான பல்வேறு அளவுகளில் உள்ள பெரிய மொழி மாதிரிகளில் (LLMs) பயனுள்ளதாக இருப்பதையும், அடிப்படை மாதிரிகள் அவற்றின் சொந்த தரவுப் பங்கீட்டுடன் சீரமைப்பதன் மூலம் அதிகப் பலனைப் பெற முடியும் என்பதையும் நாங்கள் காட்டுகிறோம். எங்கள் பணிப்பாய்வுகளில் ஒவ்வொரு கூற்றின் செயல்திறனையும் நாங்கள் மேலும் சரிபார்க்கிறோம், SelfCodeAlign ஆனது GPT-4o-விலிருந்து நேரடி டைஸ்டிலேஷன் மற்றும் OSS-Instruct மற்றும் Evol-Instruct போன்ற முன்னணி GPT-3.5 அடிப்படையிலான டைஸ்டிலேஷன் முறைகள் இரண்டையும் விட சிறப்பாக செயல்படுவதைக் காட்டுகிறது. SelfCodeAlign, ஸ்டார்கோடர்2-இன்ஸ்ட்ரக்ட் (StarCoder2-Instruct) உருவாக்கத்திற்கும் வழிவகுத்துள்ளது. இது அதிநவீன கோடிங் செயல்திறனை அடையும் முதல் முழுமையான வெளிப்படையான, அனுமதிக்கப்பட்ட உரிமம் பெற்ற, மற்றும் சுய-சீரமைப்பு செய்யப்பட்ட குறியீட்டு LLM ஆகும்.