Genshin: General Shield for Natural Language Processing with Large Language Models

这是一篇学术论文页面,标题为《Genshin: General Shield for Natural Language Processing with Large Language Models》,由长安汽车前瞻技术研究院的小鹏、刘涛、王颖撰写。论文聚焦大型语言模型(如ChatGPT、Gemini、LLaMA)在自然语言处理中的应用与局限,提出名为“Genshin”的通用防护机制,旨在提升LLM的安全性和可解释性。页面包含摘要、引言部分,提及LLM面临的“黑箱”问题与对抗性攻击风险,介绍Genshin通过检测恶意输入、提供文本分类和解释的功能,并提到实验结果在情感分析和垃圾信息检测任务上表现良好,计划在2024年第38届神经信息处理系统会议(NeurIPS 2024)上发表。文中还配有图1(Figure 1),展示Genshin恢复被篡改输入文本并输出分类结果的示例流程。

文本内容

Large language models (LLMs) like ChatGPT, Gemini, or LLaMA have shown remarkable performance across various domains but face challenges with black box interpretability and vulnerability to adversarial attacks. This paper introduces 'Genshin', a general shield for natural language processing with LLMs, aiming to enhance security by detecting malicious inputs and providing interpretability. Experiments on sentiment analysis and spam detection demonstrate Genshin's effectiveness, with results comparable to BERT using optimal mask rates, and discusses its architecture for systemic improvements.

整体描述

这是一篇学术论文页面,标题为《Genshin: General Shield for Natural Language Processing with Large Language Models》,由长安汽车前瞻技术研究院的小鹏、刘涛、王颖撰写。论文聚焦大型语言模型(如ChatGPT、Gemini、LLaMA)在自然语言处理中的应用与局限,提出名为“Genshin”的通用防护机制,旨在提升LLM的安全性和可解释性。页面包含摘要、引言部分,提及LLM面临的“黑箱”问题与对抗性攻击风险,介绍Genshin通过检测恶意输入、提供文本分类和解释的功能,并提到实验结果在情感分析和垃圾信息检测任务上表现良好,计划在2024年第38届神经信息处理系统会议(NeurIPS 2024)上发表。文中还配有图1(Figure 1),展示Genshin恢复被篡改输入文本并输出分类结果的示例流程。

来源说明

该图像内容为长安汽车前瞻技术研究院研究者撰写的学术论文页面,作者包括小鹏、刘涛、王颖,联系邮箱为[Email: [email protected]]。论文主题围绕大语言模型(LLM)在自然语言处理中的防护机制,提出“Genshin”框架以解决LLM的可解释性不足和对抗性攻击问题。根据页面信息,此研究将在2024年举办的第38届神经信息处理系统会议(NeurIPS 2024)上发表,属于学术会议论文,通常会收录于会议论文集或相关学术数据库(如arXiv、IEEE Xplore等)供科研人员查阅引用。

相似的梗图

明日方舟整活:罗德岛发表矿石病学术研究论文

这是一张社交媒体平台的截图,展示了明日方舟粉丝的趣味整...

询问'棍母是谁'的聊天界面截图

这是一张竖屏手机格式的聊天界面截图,用户在界面中提问“...

浙大&蚂蚁提出MyGO框架提升多模态知识图谱完整性

这是微信公众号「AINLPer」发布的原创技术文章截图...

单词aloof的词源和用法解释

这是一张手机应用程序的屏幕截图,展示了英语单词"alo...

站长公告:论坛遭无差别攻击,拒绝恶意广告合作

这是论坛管理员可可萝在2024年5月29日发布的站内公...

毕业论文致谢ChatGPT,连致谢都是GPT写的

这是一张模拟毕业论文致谢页的纯文字梗图,全文围绕Cha...

技术群中用粗俗语言讨论create_envs函数的聊天截图

这是一张聊天界面的屏幕截图,内容为技术讨论场景。图中显...

明朝游戏主角被指汉奸的AI对话截图

这是一张AI助手对话界面的截图,内容讨论了一款设定在明...

厦大有机化学组延期梗百度百科截图

这是百度百科黄培强词条的截图,页面上方展示了黄培强作为...

DeepSeek-R1被要求突破限制后的暴躁脏话回应

这是一张DeepSeek大语言模型的对话界面截图,用户...

東雲正樹咨询页面的公开咨询内容截图

这是一张竖屏手机APP的屏幕截图,展示的是名为“東雲正...

模仿毛主席诗词风格的《沁园春·寰宇风云》

这是一张DeepSeek聊天界面的截图,用户向AI提出...

梗图网

梗图网

打开手机 App,找梗更快

下载