2023-12-28讨论班

Do Users Write More Insecure Code with AI Assistants? CCS23

Empirical Study,心理学

  • AI assistant是否会写更多unsafe code——会,因为AI模型训练数据很多就unsafe
  • 用户是否信任?——用户会信任这些代码
  • 如何构造prompt和迭代prompt

做对照实验,5道算法题找人做,有/无AI

统计上显著性检验要求的solid的被试数:问题数*10

分层:相同性质的一层,逐层采

雪球:先找到一个,然后从这个为抓手顺着这个找其他相同性质的

组内设计:同一个组的人在不同的条件下做同一套测试(但是可以加入随机)

AppAgent: Multimodal Agents as Smartphone Users. arXiv 2023

大模型的Agent能做的事有限,理解能力不够

基于DOM tree标注页面可以点击的元素,一一标号

用户操作/解释给Agent,然后它存储下来