మల్టీప్ల్-ఇ: న్యూరల్ కోడ్ జనరేషన్ బెంచ్‌మార్కింగ్ కోసం ఒక స్కేలబుల్ మరియు పాలిగ్లాట్ విధానం

Share

Author

ఫెడెరికో కాస్సానో (నార్త్ఈస్టర్న్ యూనివర్సిటీ), జాన్ గౌవార్ (నార్త్ఈస్టర్న్ యూనివర్సిటీ), డేనియల్ గుయెన్ (హానోవర్ హై స్కూల్), సిడ్నీ గుయెన్ వెల్లెస్లీ కాలేజ్, లూనా ఫిప్స్-కోస్టిన్ (నార్త్ఈస్టర్న్ యూనివర్సిటీ), డోనాల్డ్ పింక్నీ (నార్త్ఈస్టర్న్ యూనివర్సిటీ), మింగ్-హో యీ (నార్త్ఈస్టర్న్ యూనివర్సిటీ), యాంగ్‌టియాన్ జి (నార్త్ఈస్టర్న్ యూనివర్సిటీ), కరోలిన్ జేన్ ఆండర్సన్ వెల్లెస్లీ కాలేజ్, మోలీ క్యూ ఫెల్డ్‌మన్ (ఓబెర్లిన్ కాలేజ్), అర్జున్ ఘోష్ (రాబ్లాక్స్ + నార్త్ఈస్టర్న్ యూనివర్సిటీ), మైఖేల్ గ్రీన్‌బర్గ్ (స్టీవెన్స్ ఇన్‌స్టిట్యూట్ ఆఫ్ టెక్నాలజీ), అభినవ్ జంగ్డా (మైక్రోసాఫ్ట్)

Venue

IEEE ట్రాన్సాక్షన్స్ ఆన్ సాఫ్ట్‌వేర్ ఇంజనీరింగ్ (TSE) 2023

Abstract

లార్జ్ లాంగ్వేజ్ మోడల్స్ సహజ భాష మరియు ప్రోగ్రామింగ్ భాష టెక్స్ట్‌లను రెండింటినీ రూపొందించగల సామర్థ్యాన్ని ప్రదర్శించాయి. అటువంటి మోడల్స్ బహుభాషా కోడ్ జనరేషన్‌కు అవకాశాన్ని కల్పిస్తాయి: కోడ్ జనరేషన్ మోడల్స్ ఒక భాష నుండి మరొక భాషకు జ్ఞానాన్ని సాధారణీకరించగలవా? సమకాలీన కోడ్ జనరేషన్ మోడల్స్ భావపరంగా సరైన పైథాన్ కోడ్‌ను రూపొందించగలిగినప్పటికీ, ఇతర భాషలతో వాటి సామర్థ్యాల గురించి పెద్దగా తెలియదు. మేము మల్టీప్ల్-ఇ (MultiPL-E)ని ప్రతిపాదిస్తున్నాము, ఇది యూనిట్ టెస్ట్-డ్రివెన్ కోడ్ జనరేషన్ బెంచ్‌మార్క్‌లను కొత్త భాషలకు అనువదించే ఒక సిస్టమ్. రెండు ప్రముఖ పైథాన్ కోడ్ జనరేషన్ బెంచ్‌మార్క్‌లను 18 అదనపు ప్రోగ్రామింగ్ భాషలకు అనువదించడానికి మల్టీప్ల్-ఇ (MultiPL-E)ని ఉపయోగించడం ద్వారా మేము మొట్టమొదటి భారీ బహుభాషా కోడ్ జనరేషన్ బెంచ్‌మార్క్‌ను సృష్టించాము.

విభిన్న ప్రోగ్రామింగ్ పారడైమ్‌లు మరియు ప్రజాదరణను కలిగి ఉన్న 18 భాషలకు HumanEval మరియు MBPP బెంచ్‌మార్క్‌లను విస్తరించడానికి మేము MultiPL-Eని ఉపయోగిస్తాము. ఈ కొత్త సమాంతర బెంచ్‌మార్క్‌లను ఉపయోగించి, మేము మూడు అత్యాధునిక కోడ్ జనరేషన్ మోడల్‌లైన Codex, CodeGen, మరియు InCoder యొక్క బహుభాషా పనితీరును మూల్యాంకనం చేస్తాము. అనేక ఇతర భాషల కోసం Pythonలో Codex పనితీరు దానితో సరిపోలుతుందని లేదా దానిని కూడా మించిపోతుందని మేము కనుగొన్నాము. MultiPL-Eలో ప్రాతినిధ్యం వహించబడిన ప్రోగ్రామింగ్ భాషల శ్రేణి, మోడల్ పనితీరుపై భాష యొక్క ఫ్రీక్వెన్సీ మరియు భాషా ఫీచర్ల ప్రభావాన్ని అన్వేషించడానికి మాకు అనుమతిస్తుంది. చివరగా, కొత్త ప్రోగ్రామింగ్ భాషలకు కోడ్ జనరేషన్ బెంచ్‌మార్క్‌లను కంపైల్ చేసే MultiPL-E విధానం స్కేలబుల్ మరియు విస్తరించదగినది, ఇది కొత్త మోడల్‌లు, బెంచ్‌మార్క్‌లు మరియు భాషలను మూల్యాంకనం చేయడాన్ని సరళంగా చేస్తుంది.

భవిష్యత్తును తీర్చిదిద్దడంలో మాతో చేరండి

అన్ని ఉద్యోగాలను చూడండి

తాజా

మరిన్ని ఫలితాలు

మల్టీప్ల్-ఇ: న్యూరల్ కోడ్ జనరేషన్ బెంచ్‌మార్కింగ్ కోసం ఒక స్కేలబుల్ మరియు పాలిగ్లాట్ విధానం

Author

Venue

Abstract

భవిష్యత్తును తీర్చిదిద్దడంలో మాతో చేరండి

మల్టీప్ల్-ఇ: న్యూరల్ కోడ్ జనరేషన్ బెంచ్‌మార్కింగ్ కోసం ఒక స్కేలబుల్ మరియు పాలిగ్లాట్ విధానం

Author

Venue

Abstract

Related Publications

క్యూబ్ పార్ట్: ఒక ఓపెన్-వొకబులరీ, భాగంగా నియంత్రించగల 3D జనరేటర్

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

క్యాటలాగ్-నేటివ్ LLM: సిఫార్సు కోసం తక్కువ పెనవేతతో స్పీకింగ్ ఐటెమ్-ఐడి డయాలెక్ట్

భవిష్యత్తును తీర్చిదిద్దడంలో మాతో చేరండి