Привет! Сегодня поговорим о хакинге больших языковых моделей — теме, которая становится все более актуальной с каждым днём.
Знаете, когда я впервые начал исследовать безопасность LLM, я был поражён тем, насколько они уязвимы. Эти модели — GPT, Claude, Gemini — выглядят умными и защищёнными, но на самом деле их можно обмануть десятками способов.