Data Science
Artificial Intelligence
ஒரு பில்லியனுக்கும் அதிகமான தினசரி கோரிக்கைகளை CPU-வில் வழங்குவதற்காக பெர்ட்டை நாங்கள் எவ்வாறு அளவிட்டோம்
Author
Venue
தரவு + AI உச்சிமாநாடு 2021
Abstract
எங்கள் பரந்த சமூகத்தில் உள்ள முக்கியமான சேவைகளை விரிவுபடுத்தும் எங்கள் திறனின் ஒரு முக்கிய பகுதி இயந்திர கற்றல் ஆகும். இந்த உரையாடலில், எங்கள் ஆழ்நிலை கற்றல் உரை வகைப்படுத்திகளை வினாடிக்கு 50k+ கோரிக்கைகளை 20ms-க்கும் குறைவான தாமதத்தில் செயலாக்க, விரிவுபடுத்திய எங்கள் பயணத்தைப் பகிர்ந்து கொள்கிறோம். BERT-ஐ எங்கள் பயனர்களுக்குப் போதுமான வேகமாக மாற்றுவது மட்டுமல்லாமல், CPU-வில் நிர்வகிக்கக்கூடிய செலவில் உற்பத்திக்கு இயக்கும் அளவுக்குப் போதுமான சிக்கனமாக மாற்றிய எங்கள் வழியையும் நாங்கள் பகிர்ந்து கொள்வோம்.
