செல்கோட்அலைன்: குறியீடு உருவாக்கத்திற்கான சுய சீரமைப்பு

Share

Author

யுக்சியாங் வெய் (இல்லினாய்ஸ் அர்பானா-ஷாம்பெயின் பல்கலைக்கழகம்), ஃபெடரிகோ காசானோ (நார்த்ஈஸ்டர்ன் பல்கலைக்கழகம் மற்றும் கர்சர் ஏஐ), ஜியாவெய் லியு (இல்லினாய்ஸ் அர்பானா-ஷாம்பெயின் பல்கலைக்கழகம்), யிஃபெங் டிங் (இல்லினாய்ஸ் பல்கலைக்கழகம், அர்பானா-சாம்பெயின்), நமன் ஜைன் (கலிபோர்னியா பல்கலைக்கழகம், பெர்க்லி), சக்கரி முல்லர் (ஹக்கிங் ஃபேஸ்), ஹார்ம் டி வ்ரீஸ் (சர்வீஸ்நௌ), லியான்ட்ரோ வான் வெரா (ஹக்கிங் ஃபேஸ்), அர்ஜுன் குஹா (வடகிழக்கு பல்கலைக்கழகம் மற்றும் ராப்லாக்ஸ்), லிங்மிங் ஜாங் (இல்லினாய்ஸ் பல்கலைக்கழகம், அர்பானா-சாம்பெயின்)

Venue

நியூராலிப்ஸ் 2024

Abstract

உத்தரவுச் சீரமைப்பு என்பது ஒரு மேற்பார்வையிடப்பட்ட நுணுக்கமான சீரமைப்பு அணுகுமுறையாகும், இது பெரிய மொழி மாதிரிகள் (LLMs) மனித உத்தரவுகளைப் பின்பற்றும் திறனை கணிசமாக மேம்படுத்துகிறது. பரந்த அளவிலான மனிதக் குறிப்புகள் அல்லது சுருக்கம் இல்லாமல், குறியீட்டு மொழி மாடல்களை (LLMs) தன்னிச்சையாக சீரமைப்பதற்கான முதல் முழுமையான வெளிப்படையான மற்றும் அனுமதிக்கப்பட்ட குழாயான செல்கோட்அலைன் (SelfCodeAlign)-ஐ நாங்கள் முன்மொழிகிறோம். செல்கோட்அலைன் தரவு உருவாக்கும் செயல்முறை முழுவதும் பகுப்பாய்விற்காக ஒரே அடிப்படை மாதிரியைப் பயன்படுத்துகிறது. இது முதலில் உயர்தர விதைத் துணுக்குகளிலிருந்து பல்வேறு குறியீட்டுக் கருத்துக்களைப் பிரித்தெடுத்து புதிய பணிகளை உருவாக்குகிறது. பின்னர், ஒவ்வொரு பணிக்கான பல பதில்களை மாதிரியாக எடுத்து, ஒவ்வொன்றையும் சோதனை நிகழ்வுகளுடன் இணைத்து, ஒரு சாண்ட்பாக்ஸ் சூழலில் அவற்றைச் சரிபார்க்கிறது. இறுதியாக, அறிவுறுத்தல் பயிற்சிக்காக எடுத்துக்காட்டுகள் தேர்ந்தெடுக்கப்படுகின்றன. எங்கள் முதன்மைச் சோதனைகளில், 74k அறிவுறுத்தல்-பதிலாக்க ஜோடிகளைக் கொண்ட தரவுத்தொகுப்பை உருவாக்க, CodeQwen1.5-7B உடன் SelfCodeAlign-ஐப் பயன்படுத்துகிறோம். இந்தத் தரவுத்தொகுப்பில் நுணுக்கப் பயிற்சி செய்வது, HumanEval+-இல் 67.1 pass@1-ஐ அடையும் ஒரு மாதிரியை உருவாக்குகிறது. இது CodeLlama-70B-Instruct-ஐ விட பத்து மடங்கு சிறியதாக இருந்தாலும், அதை விஞ்சுகிறது. அனைத்து அளவுகோல்களிலும், இந்த நுணுக்கமாகப் பயிற்றுவிக்கப்பட்ட மாதிரி, மனிதக் குறிப்புகள் அல்லது சுருக்கம் இல்லாமல் அறிவுறுத்தல் சரிசெய்தலுக்கான முந்தைய அதிநவீன முறையான OctoPack கொண்டு பயிற்றுவிக்கப்பட்ட அசல் பதிப்பை விட தொடர்ந்து சிறப்பாகச் செயல்படுகிறது. கூடுதலாக, SelfCodeAlign ஆனது 3B முதல் 33B வரையிலான பல்வேறு அளவுகளில் உள்ள பெரிய மொழி மாதிரிகளில் (LLMs) பயனுள்ளதாக இருப்பதையும், அடிப்படை மாதிரிகள் அவற்றின் சொந்த தரவுப் பங்கீட்டுடன் சீரமைப்பதன் மூலம் அதிகப் பலனைப் பெற முடியும் என்பதையும் நாங்கள் காட்டுகிறோம். எங்கள் பணிப்பாய்வுகளில் ஒவ்வொரு கூற்றின் செயல்திறனையும் நாங்கள் மேலும் சரிபார்க்கிறோம், SelfCodeAlign ஆனது GPT-4o-விலிருந்து நேரடி டைஸ்டிலேஷன் மற்றும் OSS-Instruct மற்றும் Evol-Instruct போன்ற முன்னணி GPT-3.5 அடிப்படையிலான டைஸ்டிலேஷன் முறைகள் இரண்டையும் விட சிறப்பாக செயல்படுவதைக் காட்டுகிறது. SelfCodeAlign, ஸ்டார்கோடர்2-இன்ஸ்ட்ரக்ட் (StarCoder2-Instruct) உருவாக்கத்திற்கும் வழிவகுத்துள்ளது. இது அதிநவீன கோடிங் செயல்திறனை அடையும் முதல் முழுமையான வெளிப்படையான, அனுமதிக்கப்பட்ட உரிமம் பெற்ற, மற்றும் சுய-சீரமைப்பு செய்யப்பட்ட குறியீட்டு LLM ஆகும்.

எதிர்காலத்தை வடிவமைக்க எங்களுடன் இணையுங்கள்

அனைத்து வேலைகளையும் காண்க

சமீபத்தியது

மேலும் முடிவுகள்

செல்கோட்அலைன்: குறியீடு உருவாக்கத்திற்கான சுய சீரமைப்பு

Author

Venue

Abstract

எதிர்காலத்தை வடிவமைக்க எங்களுடன் இணையுங்கள்

செல்கோட்அலைன்: குறியீடு உருவாக்கத்திற்கான சுய சீரமைப்பு

Author

Venue

Abstract

Related Publications

கியூப் பார்ட்: ஒரு திறந்த-சொற்களஞ்சிய, பகுதி-கட்டுப்பாடக்கூடிய 3D ஜெனரேட்டர்

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

பட்டியல்-உள்ளூர் LLM: பரிந்துரைக்காகக் குறைந்த பின்னிப்பிணைவுடன் பேசும் ஐட்டம்-ID வட்டார வழக்கு

எதிர்காலத்தை வடிவமைக்க எங்களுடன் இணையுங்கள்