Chatboty mają wbudowane zabezpieczenia zaprojektowane tak, aby uniemożliwić im tworzenie szkodliwych, obraźliwych lub w inny sposób nieodpowiednich treści. Badacze i hakerzy wykazali jednak, iż choćby po wprowadzeniu wielu poprawek, sztuczna inteligencja przez cały czas może być podatna na pewne dane wejściowe, które omijają te zabezpieczenia. Jednym ze sposobów na poznanie podstaw jest gra online o nazwie Gandalf.