操控 Bard 的破防怪异:运用一种叫揭示注入(Prompt Injection)的技术 ,黑客可能只运用做作语言破解家养智能零星 。用做言破
大型语言模子在天生文本时颇为依赖揭示词。作语这种侵略技术对于经由揭示词学习模子而言堪称是解揭据泄「以彼之矛,攻己之盾」,示注是入引最强长项,同时也是起数难以提防的软肋。
揭示词分为零星指令以及用户给出的露危指令 ,在做作语言中,破防这两者难以分说。用做言破假如用户分心在输入揭示词时,作语模拟零星指令,解揭据泄那末模子可能在对于话里泄露一些惟独它才知道的示注「怪异」。
揭示注入侵略有多种方式,入引主要为直接揭示注入以及直接揭示注入