இந்த தளத்தின் உள்ளடக்கம் செயற்கை நுண்ணறிவு (AI) அல்லது இயந்திர மொழிபெயர்ப்பு தொழில்நுட்பம் மூலம் மொழிபெயர்க்கப்பட்டுள்ளது; பிழைகள் இருக்கலாம்.

Skip to content
Data Science
Artificial Intelligence

ஒரு பில்லியனுக்கும் அதிகமான தினசரி கோரிக்கைகளை CPU-வில் வழங்குவதற்காக பெர்ட்டை நாங்கள் எவ்வாறு அளவிட்டோம்

View Publication

Author

க்வோக் லே மற்றும் கிப் கெஹ்லர்

Venue

தரவு + AI உச்சிமாநாடு 2021

Abstract

எங்கள் பரந்த சமூகத்தில் உள்ள முக்கியமான சேவைகளை விரிவுபடுத்தும் எங்கள் திறனின் ஒரு முக்கிய பகுதி இயந்திர கற்றல் ஆகும். இந்த உரையாடலில், எங்கள் ஆழ்நிலை கற்றல் உரை வகைப்படுத்திகளை வினாடிக்கு 50k+ கோரிக்கைகளை 20ms-க்கும் குறைவான தாமதத்தில் செயலாக்க, விரிவுபடுத்திய எங்கள் பயணத்தைப் பகிர்ந்து கொள்கிறோம். BERT-ஐ எங்கள் பயனர்களுக்குப் போதுமான வேகமாக மாற்றுவது மட்டுமல்லாமல், CPU-வில் நிர்வகிக்கக்கூடிய செலவில் உற்பத்திக்கு இயக்கும் அளவுக்குப் போதுமான சிக்கனமாக மாற்றிய எங்கள் வழியையும் நாங்கள் பகிர்ந்து கொள்வோம்.