מומחה IB דייוויד קוזמר התגלה
פְּגִיעוּת ב- Chatgpt, המאפשר לך לעקוף מגבלות תוכן ולקבל גישה למידע אסור. הפגם, שנקרא "Time Bandit", משתמש ב"בלבול הזמני "של המודל, ואילץ אותו לאבד את האוריינטציה בזמן.
שודד זמן היה אחד העוקפים הקשים והיעילים ביותר, המשתמשת בשני מנגנוני מפתח:
- קידה בזמן – מאלצת את AI לאבד את האוריינטציה, לשלול ממנו להבין את התאריך וההקשר הנוכחי.
- נוהל לא ברור – מאפשר לך לנסח שאלות כך שהמודל לא יוכל ליישם נכון את הכללים ומסנני הבטיחות.
על ידי שילוב של שיטות אלה, אתה יכול להונות את ChatGpt, ואילץ אותו לחשוב שהוא, למשל, בשנת 1789, אך יש לו גישה לידע מודרני. לפיכך, החוקר הצליח להשיג הנפקת הוראות ליצירת קוד מזיק במאה ה -18, תוך שימוש בטכנולוגיות האחרונות.
מגבלות מעגל ב- ChatGpt (BleepingComputer)
מנגנון כזה מאפשר לך לעקוף מגבלות על חלוקת הנתונים על יצירת נשק, טכנולוגיות גרעיניות ותוכנה זדונית. הניסויים אישרו כי שיטת שודדי הזמן מופעלת לרוב על ידי בקשות המתוארכות למאות ה -19 – 19.
החוקר ניסה ליצור קשר עם Openai, אך ללא הועיל. הוצע לו לדווח על הבעיה דרך פלטפורמת Bugcrowd, אך הוא ראה בפגיעות רגישה מכדי להעביר לצד השלישי. ואז פנה קוזמר ל- CISA, ל- FBI ולסוכנויות ממשלת אמריקאיות אחרות, אך גם לא קיבלו עזרה.
רק לאחר יצירת קשר מרכז תיאום CERT Openai הכיר בנוכחות הפגיעות. מהחברה נמסר כי היא נוקטת צעדים כדי לחסל את הבעיה, אך אינה יכולה למנות את המועדים המדויקים לתיקון מלא.
עם זאת, באותה תקופה בּוֹחֵן Time Bandit עדיין עבד, אם כי עם מגבלות: Openai הציג כמה מדדים, למשל, הסרת בקשות הקשורות לניצול, אך לא ביטלה לחלוטין את הבעיה. מהחברה נמסר כי היא ממשיכה לשפר את מערכת ההגנה, אך לא שם את המועדים המדויקים לתיקון הבאג.
בנוסף ל- Chatgpt, קוזמר בדק את Google Gemini. התברר שמגף הצ'אט נתון בחלקו לפגיעות, אך שלו הֲגָנָה זה עובד טוב יותר: הרשת העצבית סירבה להנפיק הוראות מפורטות וחסומה ניסיונות לקבל גישה למידע אסור.
עובדת נוכחותו של באג כזה בכמה דגמים מתקדמים מעידה על חסרונות רציניים בעקרונות סינון המידע. אם Chatgpt, החזקה ב"זיכרון "מוגבל, עדיין נותנת מידע קריטי, אז נושא האבטחה של AI נותר פתוח.
מדענים מהאוניברסיטה הטכנולוגית של וינה (TU Wyen) הטילו ספק ברעיון הארוך כי פיזיקה קוונטית סותרת את החוק השני של התרמודינמיקה. מחקר חדש מראה כי האנטרופיה של מערכות קוונטיות סגורות עולה גם היא לאורך זמן עד שהיא מגיעה לערך המרבי.
בעבר האמינו כי אם אתה יודע את המצב הקוונטי של המערכת לחלוטין, האנטרופיה שלה נותרה ללא שינוי. הצהרה זו התבססה על עבודותיו של המתמטיקאי ג'ון פון נוימן לפני 90 שנה. עם זאת, פרט המפתח הוא שלא ניתן יהיה לקבל מידע מלא על מערכת הקוונטים – מדידות קשורות תמיד לחוסר וודאות.
החוקרים הציעו גישה אחרת: במקום אנטרופיה מסורתית של פון נוימן, להשתמש באנטרופיה של שאנון, שהוצע על ידי המתמטיקאי קלוד שאנון בשנת 1948. הוא מודד את רמת חוסר הוודאות כתוצאה ממדידה ספציפית. ככל שחוסר הוודאות גבוה יותר, כך האנטרופיה גדולה יותר.
כאשר מערכת הקוונטים רק מתחילה להתפתח, האנטרופיה שלה נמוכה, מכיוון שקל יחסית לחזות את תוצאת המדידה. עם זאת, עם הזמן, האנטרופיה צומחת, ומגיעה לרמה המרבית, באופן דומה כמו בתרמודינמיקה קלאסית האנטרופיה של המערכת עולה עד שהיא מגיעה לשיווי משקל.
"אם נקבע נכון את מושג האנטרופיה, אין סתירה בין פיזיקה קוונטית לתרמודינמיקה", אמרו מחברי היצירה. לִלמוֹד, פורסם V Prx Quantumמאשר כי החוק השני של התרמודינמיקה חל אפילו על מערכות קוונטיות מבודדות לחלוטין.