0%

2023-12-28讨论班

Posted on 2023-12-28 In 组会记录

Do Users Write More Insecure Code with AI Assistants? CCS23

Empirical Study，心理学

AI assistant是否会写更多unsafe code——会，因为AI模型训练数据很多就unsafe
用户是否信任？——用户会信任这些代码
如何构造prompt和迭代prompt

做对照实验，5道算法题找人做，有/无AI

统计上显著性检验要求的solid的被试数：问题数*10

分层：相同性质的一层，逐层采

雪球：先找到一个，然后从这个为抓手顺着这个找其他相同性质的

组内设计：同一个组的人在不同的条件下做同一套测试(但是可以加入随机)

AppAgent: Multimodal Agents as Smartphone Users. arXiv 2023

大模型的Agent能做的事有限，理解能力不够

基于DOM tree标注页面可以点击的元素，一一标号

用户操作/解释给Agent，然后它存储下来