早上漫步时,我开启了豆包的视频通话功能,一边悠闲地散步一边愉快地交流。这种体验真是太美妙了!当我询问前方景象时,豆包立即回应道:"您前方有一辆白色轿车和一座玻璃幕墙的写字楼。"我又追问道:"能具体说说是什么车型和楼高吗?"它便细致地为我描述起来,这样的交互体验相当不错。
走到小区门口时,我再次询问周边环境。豆包准确识别出:"这里是商业街,右侧是门卫室,您现在处于小区东门出口处。"还贴心地建议:"要不要出去逛逛?"这个功能确实很实用。不过当周围有人声时,识别就会受到干扰。
我在思考:如果能改用文字指令来获取环境信息,或许效果会更好?毕竟在嘈杂的街道上,语音交流容易被打断。大家觉得呢?我的想法是:保持视频通话开启的同时,通过文字输入具体问题,这样就能避免环境噪音的干扰了。
目录
早上漫步时,我开启了豆包的视频通话功能,一边悠闲地散步一边愉快地交流。这种体验真是太美妙了!当我询问前方景象时,豆包立即回应道:"您前方有一辆白色轿车和一座玻璃幕墙的写字楼。"我又追问道:"能具体说说是什么车型和楼高吗?"它便细致地为我描述起来,这样的交互体验相当不错。
走到小区门口时,我再次询问周边环境。豆包准确识别出:"这里是商业街,右侧是门卫室,您现在处于小区东门出口处。"还贴心地建议:"要不要出去逛逛?"这个功能确实很实用。不过当周围有人声时,识别就会受到干扰。
我在思考:如果能改用文字指令来获取环境信息,或许效果会更好?毕竟在嘈杂的街道上,语音交流容易被打断。大家觉得呢?我的想法是:保持视频通话开启的同时,通过文字输入具体问题,这样就能避免环境噪音的干扰了。