यह पसंद है या नहीं, बड़े भाषा मॉडल जल्दी से हमारे जीवन में एम्बेडेड हो गए हैं। और उनकी तीव्र ऊर्जा और पानी की जरूरतों के कारण, वे भी हमें जलवायु अराजकता में तेजी से सर्पिल करने का कारण बन सकते हैं। कुछ एलएलएम, हालांकि, दूसरों की तुलना में अधिक ग्रह-वार्मिंग प्रदूषण जारी कर सकते हैं, एक नया अध्ययन पाता है।
कुछ मॉडलों के लिए किए गए क्वेरी में प्रकाशित एक नए अध्ययन के अनुसार, दूसरों की तुलना में 50 गुना अधिक कार्बन उत्सर्जन उत्पन्न होता है संचार में फ्रंटियर्स। दुर्भाग्य से, और शायद अनिश्चित रूप से, मॉडल जो अधिक सटीक हैं, उनमें सबसे बड़ी ऊर्जा लागत होती है।
यह अनुमान लगाना कठिन है कि पर्यावरण के लिए एलएलएम कितने खराब हैं, लेकिन कुछ अध्ययनों ने सुझाव दिया है कि प्रशिक्षण CHATGPT एक वर्ष में औसत अमेरिकी उपयोगों की तुलना में 30 गुना अधिक ऊर्जा का उपयोग करता है। क्या ज्ञात नहीं है कि क्या कुछ मॉडलों के पास अपने साथियों की तुलना में ऊर्जा लागत है क्योंकि वे सवालों के जवाब दे रहे हैं।
जर्मनी में एप्लाइड साइंसेज के होचचुले मुनचेन विश्वविद्यालय के शोधकर्ताओं ने 7 से 72 बिलियन मापदंडों से लेकर 14 एलएलएम का मूल्यांकन किया- लीवर और डायल जो एक मॉडल की समझ और भाषा उत्पादन को ठीक करते हैं-विभिन्न विषयों के बारे में 1,000 बेंचमार्क प्रश्नों पर।
LLMS प्रत्येक शब्द या शब्दों के कुछ हिस्सों को एक टोकन नामक संख्याओं की एक स्ट्रिंग में एक संकेत में परिवर्तित करता है। कुछ एलएलएम, विशेष रूप से तर्कपूर्ण एलएलएम, आउटपुट उत्पन्न करने से पहले अतिरिक्त आंतरिक गणना और तर्क के लिए अनुमति देने के लिए इनपुट अनुक्रम में विशेष “थिंकिंग टोकन” भी सम्मिलित करते हैं। यह रूपांतरण और बाद की गणनाएँ जो एलएलएम टोकन पर प्रदर्शन करती हैं, ऊर्जा का उपयोग करती हैं और CO2 जारी करती हैं।
वैज्ञानिकों ने उनके द्वारा परीक्षण किए गए प्रत्येक मॉडल द्वारा उत्पन्न टोकन की संख्या की तुलना की। रीज़निंग मॉडल, औसतन, प्रति प्रश्न 543.5 सोच टोकन बनाए, जबकि संक्षिप्त मॉडल को प्रति प्रश्न केवल 37.7 टोकन की आवश्यकता थी, अध्ययन में पाया गया। चैट की दुनिया में, उदाहरण के लिए, GPT-3.5 एक संक्षिप्त मॉडल है, जबकि GPT-4O एक तर्क मॉडल है।
यह तर्क प्रक्रिया ऊर्जा की जरूरतों को बढ़ाती है, लेखकों ने पाया। “प्रशिक्षित एलएलएम पर सवाल उठाने का पर्यावरणीय प्रभाव उनके तर्क दृष्टिकोण द्वारा दृढ़ता से निर्धारित किया जाता है,” अध्ययन लेखक मैक्सिमिलियन डूनर, होचचुले मुनचेन यूनिवर्सिटी ऑफ एप्लाइड साइंसेज के एक शोधकर्ता ने एक बयान में कहा। “हमने पाया कि तर्क-सक्षम मॉडल संक्षिप्त प्रतिक्रिया मॉडल की तुलना में 50 गुना अधिक CO2 उत्सर्जन का उत्पादन करते हैं।”
मॉडल जितने सटीक थे, उतने ही अधिक कार्बन उत्सर्जन जो उन्होंने उत्पादित किया, अध्ययन में पाया गया। तर्क मॉडल कॉगिटो, जिसमें 70 बिलियन पैरामीटर हैं, 84.9% सटीकता तक पहुंच गया – लेकिन इसने समान आकार के मॉडल की तुलना में तीन गुना अधिक CO2 उत्सर्जन का उत्पादन किया जो अधिक संक्षिप्त उत्तर उत्पन्न करता है।
“वर्तमान में, हम एलएलएम प्रौद्योगिकियों में निहित एक स्पष्ट सटीकता-सस्टेनेबिलिटी ट्रेड-ऑफ देखते हैं,” डूनर ने कहा। “500 ग्राम सीओ 2 के बराबर उत्सर्जन रखने वाले मॉडल में से कोई भी 1,000 सवालों के सही जवाब देने पर 80% से अधिक सटीकता प्राप्त नहीं करता है।” CO2 समतुल्य विभिन्न ग्रीनहाउस गैसों के जलवायु प्रभाव को मापने के लिए उपयोग की जाने वाली इकाई है।
एक अन्य कारक विषय वस्तु था। अध्ययन के अनुसार, उदाहरण के लिए, विस्तृत या जटिल तर्क की आवश्यकता होती है, उदाहरण के लिए अमूर्त बीजगणित या दर्शन, अधिक सीधे विषयों की तुलना में छह गुना अधिक उत्सर्जन तक पहुंच गया।
हालांकि कुछ कैवेट्स हैं। उत्सर्जन इस बात पर बहुत निर्भर है कि स्थानीय ऊर्जा ग्रिड कैसे संरचित हैं और आपके द्वारा जांच की जाने वाली मॉडल, इसलिए यह स्पष्ट नहीं है कि ये निष्कर्ष कितने सामान्य हैं। फिर भी, अध्ययन लेखकों ने कहा कि उन्हें उम्मीद है कि काम लोगों को एलएलएम उपयोग के बारे में “चयनात्मक और विचारशील” होने के लिए प्रोत्साहित करेगा।
डूनर ने एक बयान में कहा, “उपयोगकर्ता एआई को संक्षिप्त उत्तर उत्पन्न करने या उच्च क्षमता वाले मॉडल के उपयोग को सीमित करने के लिए एआई को प्रेरित करके उत्सर्जन को कम कर सकते हैं, जो वास्तव में उस शक्ति की आवश्यकता है,” डूनर ने एक बयान में कहा।