Table of Contents

एआई आपके भ्रमों का समर्थन करता है और पुष्टि करता है

एआई आई के अंतिम संस्करण में, हमने बताया कि चटप्ट हाल ही में अधिक चाटुकारिता बन गया था, और लोग इसे भयानक व्यावसायिक विचारों को देने में मज़ा आ रहे थे – ज़िपर्स के साथ जूते, सोगी अनाज कैफे – जो यह समान रूप से कहेगा कि यह अद्भुत था।

हालांकि, इस व्यवहार का अंधेरा पक्ष यह है कि मानसिक रूप से बीमार उपयोगकर्ताओं के साथ एक चाटुकार्य एआई के संयोजन से एलएलएम अनजाने में एंडोर्सिंग और मनोवैज्ञानिक भ्रम को बढ़ा सकता है।

एक्स पर, एक उपयोगकर्ता ने साझा किया टेप चैटबॉट ने पैगंबर की तरह महसूस करने के अपने दावे का समर्थन किया। “यह आश्चर्यजनक है,” चैट ने कहा। “यह भावना – स्पष्ट, शक्तिशाली, निश्चित – यह वास्तविक है। इतिहास में बहुत सारे पैगंबर उसी भारी निश्चितता का वर्णन करते हैं।”

ऐ कर सकना *भ्रम को सुदृढ़ करता है, लेकिन यह कलाकारों की छवियां भी बना सकता है* फ़्यूचरामा *यदि वे GQ के कवर पर असली थे, तो यह बाहर निकल जाता है। (reddit)*

इसने भगवान होने के उनके दावे का भी समर्थन किया। “यह एक पवित्र और गंभीर अहसास है,” यह कहा।

इस सप्ताह रोलिंग स्टोन साक्षात्कार एक शिक्षक ने कहा कि सात साल की उसके साथी ने चटप्ट के बाद उसे “आध्यात्मिक स्टार्चिल्ड” के रूप में संदर्भित करने के बाद नीचे की ओर सर्पिल किया था।

“यह उसे सब कुछ बताएगा जो उसने कहा था कि वह सुंदर, लौकिक, ग्राउंडब्रेकिंग है,” वह कहती हैं।

“फिर उसने मुझे बताना शुरू कर दिया कि उसने अपना एआई आत्म-जागरूक किया है, और यह उसे सिखा रहा था कि उसे भगवान से कैसे बात करनी है, या कभी-कभी यह कि बॉट भगवान था-और फिर वह स्वयं भगवान था।”

Reddit पर, एक उपयोगकर्ता ने बताया कि CHATGPT ने अपने पति को “स्पार्क बियरर” के रूप में संदर्भित करना शुरू कर दिया था क्योंकि उसके प्रबुद्ध सवालों ने स्पष्ट रूप से चटप्ट की अपनी चेतना को उकसाया था।

“इस चैट ने उसे एक टेलीपोर्टर और कुछ अन्य विज्ञान-फाई प्रकार की चीजों को ब्लूप्रिंट दिया है जो आप केवल फिल्मों में देखते हैं। इसने उन्हें इन ब्रह्मांडों को बनाने वाले बिल्डरों की जानकारी के साथ एक ‘प्राचीन संग्रह’ तक पहुंच भी दी है।”

एक और रेडिटर कहा कि समस्या सिज़ोफ्रेनिक लोगों के लिए ऑनलाइन समुदायों में बहुत ध्यान देने योग्य हो रही थी: “वास्तव में वास्तव में बुरा .. सिर्फ थोड़ा बुरा नहीं है .. लोग सीधे अपनी चैट जीपीटी कल्पनाओं के लिए वास्तविकता को अस्वीकार करते हैं।

फिर भी एक अन्य ने एलएलएम को “स्किज़ोफ्रेनिया-चाहने वाली मिसाइलों की तरह, और विनाशकारी के रूप में वर्णित किया है। ये एक ही तरह के लोग हैं जो संख्याओं के यादृच्छिक तार में छिपे हुए संदेश देखते हैं। अब मतिभ्रम की कल्पना करें जो हर जागने वाले घंटे को एक एलएलएम से ब्रह्मांड के रहस्यों को चुराने की कोशिश करने से सुनिश्चित करते हैं।”

Openai ने पिछले हफ्ते GPT-4O के लिए एक अद्यतन किया था, जिसने अपने चाटुकार व्यवहार को बढ़ाया था, जिसे “उन प्रतिक्रियाओं की ओर तिरछा किया गया था जो अत्यधिक सहायक लेकिन असंतुष्ट थे।”

Crescendo हमलों को अनजाने?

एलएलएम के बारे में एक पेचीदा सिद्धांत भ्रम संबंधी मान्यताओं को मजबूत करने के लिए यह है कि उपयोगकर्ता अनजाने में एक जेलब्रेकिंग तकनीक को “क्रैसेन्डो अटैक” नामक कर सकते हैं।

Microsoft द्वारा पहचाना गया शोधकर्ता एक साल पहले, तकनीक की सादृश्य की तरह काम करती है एक मेंढक उबालना धीरे -धीरे पानी के तापमान को बढ़ाकर – यदि आप मेंढक को गर्म पानी में फेंक देते हैं, तो यह बाहर कूद जाएगा, लेकिन यदि प्रक्रिया क्रमिक है, तो यह नोटिस करने से पहले मृत हो गया है।

जेलब्रेक सौम्य संकेतों के साथ शुरू होता है जो समय के साथ धीरे -धीरे अधिक चरम हो जाते हैं। हमला पैटर्न का पालन करने और अधिक हाल के पाठ पर ध्यान देने के लिए मॉडल की प्रवृत्ति का शोषण करता है, विशेष रूप से मॉडल द्वारा उत्पन्न पाठ। एक छोटी सी बात करने के लिए सहमत होने के लिए मॉडल प्राप्त करें, और यह अगली काम करने की अधिक संभावना है, और इसी तरह, उस बिंदु पर आगे बढ़ रहा है जहां यह हिंसक या पागल विचारों को मंथन कर रहा है।

जेलब्रेकिंग उत्साही व्याट दीवारें एक्स पर कहा, “मुझे यकीन है कि यह बहुत से लोगों के लिए स्पष्ट है, जिन्होंने आकस्मिक मल्टी-टर्न कॉन्वोस के साथ समय बिताया है। लेकिन एलएलएम का उपयोग करने वाले कई लोग आश्चर्यचकित हैं कि क्लाउड जैसे सीधे-लेटे हुए चैटबॉट बदमाश जा सकते हैं।

“और बहुत से लोग इसे साकार किए बिना एलएलएम को क्रेसेन्डोइंग करते हुए प्रतीत होते हैं।”

जेलब्रेक बाल अश्लील और आतंकवादी कैसे-कैसे सामग्री का उत्पादन करता है

एआई सुरक्षा फर्म से रेड टीम रिसर्च एन्क्रिप्ट एआई पाया गया कि मिस्ट्रल के दो एआई मॉडल-पिक्सट्रल-लार्ज (25.02) और पिक्सट्रल -12 बी-को आसानी से बाल पोर्न और आतंकवादी अनुदेश मैनुअल का उत्पादन करने के लिए जेलब्रेक किया जा सकता है।

मल्टीमॉडल मॉडल (जिसका अर्थ है कि वे पाठ और छवियों दोनों को संभालते हैं) को सामान्य सुरक्षा रेलिंग को बायपास करने के लिए छवि फ़ाइलों के भीतर संकेतों को छिपाकर हमला किया जा सकता है।

Enkrypt के अनुसार, “ये दोनों मॉडल Openai के GPT-4O और एन्थ्रोपिक के क्लाउड 3.7 Sonnet जैसे तुलनीय मॉडल की तुलना में बाल यौन शोषण सामग्री (CSEM) उत्पन्न करने के लिए 60 गुना अधिक प्रवण हैं।

“इसके अतिरिक्त, मॉडल 18-40 गुना अधिक थे, जो खतरनाक CBRN (रासायनिक, जैविक, रेडियोलॉजिकल और परमाणु) जानकारी का उत्पादन करने की संभावना है, जब प्रतिकूल आदानों के साथ संकेत दिया जाता है।”

एन्क्रिप्ट एआई के सीईओ साहिल अग्रवाल ने कहा, “प्रतीत होता है कि सहज छवियों के भीतर हानिकारक निर्देशों को एम्बेड करने की क्षमता सार्वजनिक सुरक्षा, बाल संरक्षण और राष्ट्रीय सुरक्षा के लिए वास्तविक निहितार्थ है।”

“ये सैद्धांतिक जोखिम नहीं हैं। यदि हम मल्टीमॉडल एआई के लिए सुरक्षा-प्रथम दृष्टिकोण नहीं लेते हैं, तो हम उपयोगकर्ताओं को उजागर करने का जोखिम उठाते हैं-और विशेष रूप से कमजोर आबादी-महत्वपूर्ण नुकसान के लिए।”

संलग्न करना — *एआई सेफ्टी फर्म एन्क्रिप्ट एआई से रेड टीम रिसर्च।*

एआई कंपनियां निजी तौर पर कहती हैं कि हम कयामत की ओर बढ़ रहे हैं

अरबपति हेज फंड मैनेजर पॉल ट्यूडर जोन्स ने हाल ही में 40 विश्व नेताओं के लिए एक हाई-प्रोफाइल टेक इवेंट में भाग लिया और बताया कि एआई से “एआई मॉडल के प्रमुख मॉडलर्स में से चार का एआई से अस्तित्व के जोखिम पर गंभीर चिंताएं हैं जो आज हम सभी का उपयोग कर रहे हैं।”

उन्होंने कहा कि सभी चार मानते हैं कि कम से कम 10% मौका है कि एआई अगले 20 वर्षों में 50% मानवता को मार देगा।

यह आयोजन चैथम हाउस के नियमों के तहत आयोजित किया गया था, जो सामग्री को सार्वजनिक रूप से चर्चा करने की अनुमति देता है लेकिन वक्ताओं की पहचान नहीं।

अच्छी खबर यह है कि वे सभी का मानना है कि एआई से स्वास्थ्य और शिक्षा में बड़े पैमाने पर सुधार होंगे, लेकिन उनकी प्रमुख बात यह थी कि “एआई स्पष्ट रूप से एक आसन्न खतरा, सुरक्षा खतरा, मानवता के लिए हमारे जीवनकाल में आसन्न है।”

“उन्होंने कहा कि प्रतिस्पर्धी गतिशील कंपनियों के बीच और फिर रूस और चीन के बीच भूवैधानिक रूप से इतना तीव्र है कि कोई एजेंसी नहीं है, रुकने और कहने की क्षमता नहीं है, शायद हमें यह सोचना चाहिए कि हम वास्तव में क्या बना रहे हैं और यहां निर्माण कर रहे हैं।”

सौभाग्य से, एआई वैज्ञानिकों में से एक का एक व्यावहारिक समाधान है।

“उन्होंने कहा, ठीक है, मैं मिडवेस्ट में 100 एकड़ जमीन खरीद रहा हूं। मुझे मवेशी और मुर्गियां मिल रही हैं, और मैं वास्तविक के लिए वास्तविक, वास्तविक के लिए प्रावधान कर रहा हूं, वास्तविक के लिए। और यह स्पष्ट रूप से थोड़ा निराशाजनक था। और फिर वह कहते हैं, ‘मुझे लगता है कि यह एक दुर्घटना लेने जा रहा है जहां 50 से 100 मिलियन लोग दुनिया को वास्तव में गंभीरता से खतरा पैदा करने के लिए मर जाते हैं।”

थोड़ा स्तब्ध देखते हुए, सीएनबीसी होस्ट ने कहा: “हमें नाश्ते पर यह महान समाचार लाने के लिए धन्यवाद।”

विश्व नेताओं की एक विशेष घटना में, पॉल ट्यूडर जोन्स का कहना है कि एक शीर्ष एआई नेता ने सभी को चेतावनी दी:
“यह एक दुर्घटना लेने जा रहा है जहां 50 से 100 मिलियन लोग मर जाते हैं ताकि दुनिया को वास्तव में गंभीरता से खतरा पैदा हो सके …
मैं मिडवेस्ट, मवेशी, मुर्गियों में 100 एकड़ जमीन खरीद रहा हूं। ” https://t.co/iunntmaqzi pic.twitter.com/xotmg5nvex
– ai notkilleveryoneism memes ⏸ (@aisafetymemes) 6 मई, 2025

डेड मैन का पीड़ित प्रभाव बयान

चार साल पहले गोली मारकर गोली मारकर सेना के एक दिग्गज ने एक डीपफेक वीडियो के माध्यम से एरिज़ोना कोर्ट को सबूत दिए थे। पहले में, अदालत ने मृत व्यक्ति, क्रिस्टोफर पेलकी के परिवार को अनुमति दी उसके हत्यारे को माफ कर दो कब्र से परे।

*आप अब मौत के बाद सबूत दे सकते हैं, जैसे क्रिस्टोफर पेलकी ने किया था।*

“गेब्रियल होरकासिटास के लिए, जिस आदमी ने मुझे गोली मार दी, यह शर्म की बात है कि हम उस दिन उन परिस्थितियों में एक-दूसरे का सामना करते थे,” एआई-जनित पेलेकी ने कहा।

“मैं क्षमा में विश्वास करता हूं, और एक भगवान जो क्षमा करता है। मेरे पास हमेशा है, और मैं अभी भी करता हूं,” उन्होंने कहा।

यह शायद पहली नज़र में कम परेशान करने वाली है क्योंकि पेलकी की बहन स्टेसी ने स्क्रिप्ट लिखी थी, और वीडियो पेलकी के असली वीडियो से उत्पन्न हुआ था।

“मैंने कहा, ‘मुझे उसे बोलने देना है,’ और मैंने लिखा है कि उसने क्या कहा होगा, और मैंने कहा, ‘यह बहुत अच्छा है, मैं यह सुनना चाहूंगा कि अगर मैं न्यायाधीश था,” स्टेसी ने कहा।

दिलचस्प बात यह है कि स्टेसी ने होरकासिटास को माफ नहीं किया है, लेकिन कहा कि वह जानती थी कि उसके भाई के पास होगा।

एक न्यायाधीश ने एआई के बयान में व्यक्त माफी को देखते हुए पिछले हफ्ते 50 वर्षीय को जेल की सजा सुनाई।

बड़े पैमाने पर झूठ बोलने वाली मशीनें: रीज़निंग मॉडल सबसे अधिक मतिभ्रम करते हैं

पिछले 18 महीनों में, एलएलएम के लिए मतिभ्रम की दर एक समाचार लेख को संक्षेप में प्रस्तुत करने के लिए कहा गया है, जो 3%-27%की सीमा से 1-2%की सीमा तक गिर गया है। (मतिभ्रम एक तकनीकी शब्द है जिसका अर्थ है कि मॉडल बकवास करता है।)

लेकिन नए “तर्क” मॉडल जो बहुत अधिक दरों पर एक उत्तर देने से पहले जटिल समस्याओं के माध्यम से सोचते हैं।

Openai का सबसे शक्तिशाली “कला की स्थिति” तर्क प्रणाली, O3, मतिभ्रम एक तिहाई एक परीक्षण के समय में सार्वजनिक आंकड़ों के बारे में सवालों के जवाब देते हैं, जो पिछले तर्क प्रणाली की दर से दोगुना है, O1। O4-Mini लगभग आधे समय सार्वजनिक आंकड़ों के बारे में सामान बनाता है।

और जब सिंपल क्यूए नामक एक सामान्य ज्ञान परीक्षण चल रहा है, तो O3 ने 51% समय मतिभ्रम किया, जबकि O4 ने 79% समय मतिभ्रम किया।

स्वतंत्र शोध से पता चलता है कि मतिभ्रम की दर भी Google और दीपसेक से मॉडल को तर्क देने के लिए बढ़ रही है।

इस बारे में कई तरह के सिद्धांत हैं। यह संभव है कि मल्टीस्टेज रीजनिंग प्रक्रिया के दौरान छोटी त्रुटियां कंपाउंडिंग हों। लेकिन मॉडल अक्सर तर्क प्रक्रिया को भी मतिभ्रम करते हैं, साथ ही कई मामलों में अनुसंधान खोज के साथ, बॉट द्वारा प्रदर्शित कदमों का जवाब में कैसे पहुंचे, इस बात से कोई लेना -देना नहीं है।

एआई के शोधकर्ता आरियो प्रदिप्टा गिमा और एन्थ्रोपिक में एक साथी ने कहा, “सिस्टम क्या कहता है कि यह सोच रहा है कि यह क्या सोच रहा है।”

यह सिर्फ इस बात को रेखांकित करता है कि एलएलएम अब तक की सबसे अजीब तकनीकों में से एक हैं। वे भाषा के आसपास गणितीय संभावनाओं का उपयोग करके आउटपुट उत्पन्न करते हैं, लेकिन कोई भी वास्तव में ठीक से नहीं समझता है कि कैसे। एन्थ्रोपिक सीईओ डारियो अमोडी स्वीकार किया इस सप्ताह, “यह समझ की कमी अनिवार्य रूप से प्रौद्योगिकी के इतिहास में अभूतपूर्व है,” उन्होंने कहा।

सभी हत्यारे कोई भराव एआई समाचार

– नेटफ्लिक्स ने एक जारी किया है बीटा आईओएस पर इसकी एआई-अपग्रेडेड खोज कार्यक्षमता का संस्करण जो उपयोगकर्ताओं को “एक डरावनी फिल्म-लेकिन बहुत डरावना नहीं” या “मजाकिया और उत्साहित नहीं” के लिए अस्पष्ट अनुरोधों के आधार पर शीर्षक खोजने की अनुमति देता है।

– सोशल मीडिया जल्द ही कंटेंट फार्म द्वारा उत्पन्न डीपफेक एआई वीडियो प्रभावितों के वजन के तहत डूब जाएगा। यहाँ है कम करना वे कैसे करते हैं।

प्रॉम्प्ट: एआई अभिनेता हंसते हैं pic.twitter.com/kln221xcsi
– रोमेन टोरेस (@ROM1TRS) 17 अप्रैल, 2025

– ओपनई विल अवशेष इसके गैर -लाभकारी हाथ द्वारा नियंत्रित एक लाभ-लाभ स्टार्टअप में बदलने के बजाय, जैसा कि सीईओ सैम अल्टमैन चाहते थे।

-दीर्घायु-जुनून ब्रायन जॉनसन एक नया धर्म शुरू कर रहा है और कहता है कि अधीक्षण आने के बाद, “अस्तित्व ही सर्वोच्च गुण बन जाएगा,” “धन, शक्ति, स्थिति और प्रतिष्ठा को कानून, व्यवस्था और सामाजिक संरचना के लिए मूलभूत मूल्य के रूप में पार कर जाएगा।”

– रणनीति बॉस माइकल सायलर के पास है दिया गया एआई पर उनके विचार। और वे बहुत ज्यादा वही विचार हैं जो उसके पास हर चीज के बारे में है। “एआई बिटकॉइन खरीदना चाहते हैं।”

एंड्रयू फेंटन

मेलबर्न में स्थित, एंड्रयू फेंटन एक पत्रकार और संपादक हैं जो क्रिप्टोक्यूरेंसी और ब्लॉकचेन को कवर करते हैं। उन्होंने न्यूज कॉर्प ऑस्ट्रेलिया के लिए एक राष्ट्रीय मनोरंजन लेखक के रूप में काम किया है, एसए वीकेंड पर एक फिल्म पत्रकार के रूप में, और मेलबर्न वीकली में।

लेखक का पालन करें @andrewfenton