ఈ సైట్‌లోని విషయాలు కృత్రిమ మేధస్సు (AI) లేదా యంత్ర అనువాద సాంకేతికత ఉపయోగించి అనువదించబడ్డాయి మరియు లోపాలు ఉండవచ్చు.

Skip to content
Artificial Intelligence
Natural Language Processing
Programming Languages

మల్టీప్ల్-ఇ: న్యూరల్ కోడ్ జనరేషన్ బెంచ్‌మార్కింగ్ కోసం ఒక స్కేలబుల్ మరియు పాలిగ్లాట్ విధానం

View Publication

Author

ఫెడెరికో కాస్సానో (నార్త్ఈస్టర్న్ యూనివర్సిటీ), జాన్ గౌవార్ (నార్త్ఈస్టర్న్ యూనివర్సిటీ), డేనియల్ గుయెన్ (హానోవర్ హై స్కూల్), సిడ్నీ గుయెన్ వెల్లెస్లీ కాలేజ్, లూనా ఫిప్స్-కోస్టిన్ (నార్త్ఈస్టర్న్ యూనివర్సిటీ), డోనాల్డ్ పింక్నీ (నార్త్ఈస్టర్న్ యూనివర్సిటీ), మింగ్-హో యీ (నార్త్ఈస్టర్న్ యూనివర్సిటీ), యాంగ్‌టియాన్ జి (నార్త్ఈస్టర్న్ యూనివర్సిటీ), కరోలిన్ జేన్ ఆండర్సన్ వెల్లెస్లీ కాలేజ్, మోలీ క్యూ ఫెల్డ్‌మన్ (ఓబెర్లిన్ కాలేజ్), అర్జున్ ఘోష్ (రాబ్లాక్స్ + నార్త్ఈస్టర్న్ యూనివర్సిటీ), మైఖేల్ గ్రీన్‌బర్గ్ (స్టీవెన్స్ ఇన్‌స్టిట్యూట్ ఆఫ్ టెక్నాలజీ), అభినవ్ జంగ్డా (మైక్రోసాఫ్ట్)

Venue

IEEE ట్రాన్సాక్షన్స్ ఆన్ సాఫ్ట్‌వేర్ ఇంజనీరింగ్ (TSE) 2023

Abstract

లార్జ్ లాంగ్వేజ్ మోడల్స్ సహజ భాష మరియు ప్రోగ్రామింగ్ భాష టెక్స్ట్‌లను రెండింటినీ రూపొందించగల సామర్థ్యాన్ని ప్రదర్శించాయి. అటువంటి మోడల్స్ బహుభాషా కోడ్ జనరేషన్‌కు అవకాశాన్ని కల్పిస్తాయి: కోడ్ జనరేషన్ మోడల్స్ ఒక భాష నుండి మరొక భాషకు జ్ఞానాన్ని సాధారణీకరించగలవా? సమకాలీన కోడ్ జనరేషన్ మోడల్స్ భావపరంగా సరైన పైథాన్ కోడ్‌ను రూపొందించగలిగినప్పటికీ, ఇతర భాషలతో వాటి సామర్థ్యాల గురించి పెద్దగా తెలియదు. మేము మల్టీప్ల్-ఇ (MultiPL-E)ని ప్రతిపాదిస్తున్నాము, ఇది యూనిట్ టెస్ట్-డ్రివెన్ కోడ్ జనరేషన్ బెంచ్‌మార్క్‌లను కొత్త భాషలకు అనువదించే ఒక సిస్టమ్. రెండు ప్రముఖ పైథాన్ కోడ్ జనరేషన్ బెంచ్‌మార్క్‌లను 18 అదనపు ప్రోగ్రామింగ్ భాషలకు అనువదించడానికి మల్టీప్ల్-ఇ (MultiPL-E)ని ఉపయోగించడం ద్వారా మేము మొట్టమొదటి భారీ బహుభాషా కోడ్ జనరేషన్ బెంచ్‌మార్క్‌ను సృష్టించాము.


విభిన్న ప్రోగ్రామింగ్ పారడైమ్‌లు మరియు ప్రజాదరణను కలిగి ఉన్న 18 భాషలకు HumanEval మరియు MBPP బెంచ్‌మార్క్‌లను విస్తరించడానికి మేము MultiPL-Eని ఉపయోగిస్తాము. ఈ కొత్త సమాంతర బెంచ్‌మార్క్‌లను ఉపయోగించి, మేము మూడు అత్యాధునిక కోడ్ జనరేషన్ మోడల్‌లైన Codex, CodeGen, మరియు InCoder యొక్క బహుభాషా పనితీరును మూల్యాంకనం చేస్తాము. అనేక ఇతర భాషల కోసం Pythonలో Codex పనితీరు దానితో సరిపోలుతుందని లేదా దానిని కూడా మించిపోతుందని మేము కనుగొన్నాము. MultiPL-Eలో ప్రాతినిధ్యం వహించబడిన ప్రోగ్రామింగ్ భాషల శ్రేణి, మోడల్ పనితీరుపై భాష యొక్క ఫ్రీక్వెన్సీ మరియు భాషా ఫీచర్ల ప్రభావాన్ని అన్వేషించడానికి మాకు అనుమతిస్తుంది. చివరగా, కొత్త ప్రోగ్రామింగ్ భాషలకు కోడ్ జనరేషన్ బెంచ్‌మార్క్‌లను కంపైల్ చేసే MultiPL-E విధానం స్కేలబుల్ మరియు విస్తరించదగినది, ఇది కొత్త మోడల్‌లు, బెంచ్‌మార్క్‌లు మరియు భాషలను మూల్యాంకనం చేయడాన్ని సరళంగా చేస్తుంది.