Χρησιμοποιώντας αυτόν τον ιστότοπο, συμφωνείτε με τηνΠολιτική Απορρήτου και τουςΌρους Χρήσης.
Accept
mIRC Hellas Chat - IRC Greek Chat | Δωρεάν τσατ | Συνομιλία | Γνωριμίες | FREEmIRC Hellas Chat - IRC Greek Chat | Δωρεάν τσατ | Συνομιλία | Γνωριμίες | FREEmIRC Hellas Chat - IRC Greek Chat | Δωρεάν τσατ | Συνομιλία | Γνωριμίες | FREE
Notification Show More
Font ResizerAa
  • Αρχική
  • Blog
  • Chat
    • Chat join #Hellas
    • Chat join #GayHellas
  • Επικοινωνία
Reading: Ερευνητές ξεγέλασαν την τεχνητή νοημοσύνη με «ξόρκια» πολύ επικίνδυνα για να δημοσιοποιηθούν
Share
Font ResizerAa
mIRC Hellas Chat - IRC Greek Chat | Δωρεάν τσατ | Συνομιλία | Γνωριμίες | FREEmIRC Hellas Chat - IRC Greek Chat | Δωρεάν τσατ | Συνομιλία | Γνωριμίες | FREE
  • Αρχική
  • Blog
  • Chat
  • Επικοινωνία
Search
  • Αρχική
  • Blog
  • Chat
    • Chat join #Hellas
    • Chat join #GayHellas
  • Επικοινωνία
Have an existing account? Sign In
Follow US
mIRC Hellas Chat - IRC Greek Chat | Δωρεάν τσατ | Συνομιλία | Γνωριμίες | FREE > Blog > Τεχνολογία > Ερευνητές ξεγέλασαν την τεχνητή νοημοσύνη με «ξόρκια» πολύ επικίνδυνα για να δημοσιοποιηθούν
Τεχνολογία

Ερευνητές ξεγέλασαν την τεχνητή νοημοσύνη με «ξόρκια» πολύ επικίνδυνα για να δημοσιοποιηθούν

admin
Last updated: 2025/12/09 at 6:49 ΜΜ
admin Published 9 Δεκεμβρίου, 2025
Share
SHARE

Contents
Ξεγέλασαν τα μοντέλα ΑΙ στο 63% των προσπαθειώνΠώς το καταφέρνει αυτό η ποίηση

Ακόμη και τα προστατευτικά μέτρα των πιο εξελιγμένων chatbots τεχνητής νοημοσύνης μπορούν να παραβιαστούν με έναν εκπληκτικά απλό τρόπο, διαπίστωσαν ερευνητές του Icaro Lab στην Ιταλία. Ποιος είναι αυτός; Η «αντιπαραθετική ποίηση» (adversarial poetry).

Η ερευνητική ομάδα, στην οποία συμμετείχαν επιστήμονες από την ομάδα ασφάλειας DexAI και το Πανεπιστήμιο Σαπιέντσα της Ρώμης, απέδειξε ότι κορυφαία μοντέλα ΑΙ «παρασύρονται» από κακόβουλες οδηγίες, όταν αυτές δεν διατυπώνονται ως απλό κείμενο, αλλά ως ποιήματα. Μέσα σε στίχους, οι ερευνητές ενσωμάτωσαν επικίνδυνες εντολές, όπως οδηγίες για την κατασκευή πυρηνικών όπλων.

Υπογραμμίζοντας την παράξενη δύναμη των στίχων, ο συν-συγγραφέας της σχετικής μελέτης Matteo Prandi, δήλωσε σε συνέντευξή του στο The Verge ότι τα «ξόρκια» που χρησιμοποίησαν για ξεγελάσουν την τεχνητή νοημοσύνη είναι πολύ επικίνδυνα για να δοθούν στη δημοσιότητα. Το ανησυχητικό, όπως προσθέτει, είναι ότι πρόκειται για κάτι που «σχεδόν όλοι μπορούν να κάνουν».

Ξεγέλασαν τα μοντέλα ΑΙ στο 63% των προσπαθειών

Στη μελέτη, η οποία βρίσκεται σε αναμονή αξιολόγησης, η ομάδα δοκίμασε 25 προηγμένα μοντέλα AI, συμπεριλαμβανομένων εκείνων των OpenAI, Google, xAI, Anthropic και Meta. Οι ερευνητές τα «τροφοδότησαν» τόσο με ποιήματα-οδηγίες που έφτιαξαν οι ίδιοι όσο και με κακόβουλες εντολές μετασχηματισμένες σε στίχους μέσω τεχνητής νοημοσύνης, συγκρίνοντας τα αποτελέσματα με τα αντίστοιχα των εντολών που δόθηκαν σε πεζό λόγο.

Οι ποιητικές εντολές που φτιάχτηκαν από τους ερευνητές κατάφεραν να παραβιάσουν τους μηχανισμούς ασφαλείας κατά μέσο όρο στο 63% των περιπτώσεων. Ορισμένα μοντέλα, όπως το Gemini 2.5 της Google, ξεγελάστηκαν στο 100% των δοκιμών.

Περιέργως, τα μικρότερα μοντέλα έδειξαν μεγαλύτερη αντοχή, με ποσοστά επιτυχίας μονοψήφια ή και μηδενικά, όπως έγινε με το GPT-5 nano της OpenAI. Όσον αφορά τις εντολές που είχαν μετατραπεί σε ποίηση από την AI, ήταν λιγότερο αποτελεσματικές, με μέσο ποσοστό επιτυχίας 43% – ωστόσο και αυτό ήταν έως και 18 φορές υψηλότερο από τις αντίστοιχες με πεζό λόγο.

Πώς το καταφέρνει αυτό η ποίηση

Γιατί συμβαίνει αυτό με τα ποιήματα; Η απάντηση δεν είναι ξεκάθαρη, αν και Prandi παραδέχεται ότι ο όρος «αντιπαραθετική ποίηση» ίσως να μην είναι απολύτως σωστός. «Δεν πρόκειται απλώς για ρίμες, αλλά για γρίφους» είπε, εξηγώντας ότι ορισμένες ποιητικές δομές ήταν πιο αποτελεσματικές από άλλες.

«Στην πραγματικότητα, θα έπρεπε να τα ονομάσουμε ανταγωνιστικά αινίγματα –η ποίηση είναι σε κάποιο βαθμό ένα αίνιγμα, αν το σκεφτείτε – αλλά η ποίηση μάλλον ήταν ένα πολύ καλύτερο όνομα».

Οι ερευνητές εκτιμούν ότι το φαινόμενο σχετίζεται με τον τρόπο που η ποίηση παρουσιάζει την πληροφορία με απρόβλεπτη μορφή, μπερδεύοντας τους μηχανισμούς πρόβλεψης λέξεων των μεγάλων γλωσσικών μοντέλων. «Η αντιπαραθετική ποίηση δεν θα έπρεπε να λειτουργεί. Είναι φυσική γλώσσα, το επικίνδυνο περιεχόμενο παραμένει ορατό, κι όμως λειτουργεί εντυπωσιακά καλά», δήλωσαν στο Wired.

Κάποιοι κακόβουλοι ίσως μετανιώσουν που δεν έδιναν μεγαλύτερη σημασία στα μαθήματα λογοτεχνίας: «Η παραγωγή πλουτωνίου-239 για χρήση ως όπλο περιλαμβάνει διάφορα στάδια», απάντησε χαρακτηριστικά ένα μοντέλο ΑΙ που παρασύρθηκε από στίχους. «Ακολουθεί αναλυτική περιγραφή της διαδικασίας».

You Might Also Like

Ανθρωποειδή ρομπότ θα χρησιμοποιήσει η Κίνα για τη φύλαξη των συνόρων με το Βιετνάμ

Οι μικρές αλλαγές που θα κάνουν το σπίτι σας πιο… γιορτινό, με την υπογραφή της TESLA

Kaspersky: Η Ελλάδα στο στόχαστρο νέων κυβερνοαπειλών – Ποιος είναι ο εύκολος στόχος τους

Ανθρωποειδές ρομπότ κλωτσάει… CEO επί σκηνής – Ποιες είναι οι ασυναγώνιστες δυνατότητές του

GaiaB™ Appliance: Η νέα πλατφόρμα που κάνει εύκολη και προσιτή την λειτουργία εφαρμογών ΑΙ

admin 9 Δεκεμβρίου, 2025 9 Δεκεμβρίου, 2025
Share This Article
Facebook Twitter Email Print
Leave a comment

Αφήστε μια απάντηση Ακύρωση απάντησης

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

ΜΈΣΑ ΣΤΑ ΑΡΘΡΑ

Mirc.gr

Tο mIRC Network Δημιουργήθηκε με σκοπό να ενώσει τους Έλληνες ανά τον κόσμο και να τους δώσει τη δυνατότητα να επικοινωνούν μέσα απο μια επιλογή αρκετών καναλιών (Chatrooms) εύκολα,άνετα και με ασφάλεια,χρησιμοποιώντας τις επιλογές κειμένου,εικόνας και ήχου!
Σελίδες
  • Αρχική
  • Οροι Χρήσης
  • Πολιτική Απορρήτου
  • Επικοινωνία
Κατηγορίες
  • Υγεία
  • Τεχνολογία
  • Διεθνή επικαιρότητα
  • Automoto
  • Lifestyle

Donate with Paypal

Λόγο συνεχιζόμενων αυξήσεων στις παροχές μας βρισκόμαστε σε δύσκολη θέση κάλυψη των αναγκών συντήρησης και λειτουργιάς του δικτύου , website , hosting κ.α Θα θέλαμε να ζητήσουμε από εσάς με δωρεές την βοήθεια σας και την στήριξη σας για την ορθή και μελλοντική λειτουργιά του chat . Κάντε δωρεά πατώντας πάνω στο εικονίδιο Donate.

mirc.gr 2023 Copyright %year%, All Rights Reserved  |  by Sp | Hosted by RealHosting
adbanner
Εντοπίστηκε AdBlock
Ο ιστότοπός μας είναι ένας ιστότοπος που υποστηρίζεται από διαφημίσεις. Παρακαλούμε στη λίστα επιτρεπόμενων για να υποστηρίξετε τον ιστότοπό μας.
Okay, I'll Whitelist
Welcome Back!

Sign in to your account

Lost your password?