声网Agora 双师课堂解决方案

今年中旬,有一则报道“刷遍了”朋友圈。四川省一所民办农村小学,老师通过一根网线,把远在美国俄勒冈州的英语老师,与坐在不到 20 平米小教室里的几十名山村少年连接到了一起。这些可能还未走出过自己家乡的孩子,通过实时音视频技术,认识了山外的世界。这既是一场普通的双师课堂,也是近几年在线教育行业中最不可忽视的趋势。

根据市场预测,未来 5 年内,双师课堂将覆盖全国所有一至六线城市中小学校,课堂布局将达50万间,学员数量可达3000万左右。仅安徽省,近三年来已累计投入资金53亿元,用于创新应用在线课堂教学模式,实现了教学点全覆盖。从2015年到2017年,经历三年运营模式的探索,双师课堂于2018年迎来爆发式增长,双师教室布局数量达到5000+,增速超过100%,双师课堂进入高速发展阶段。

按照发生的场景来划分,双师课堂有 两种类型

一种是专递课堂、同步课堂,现在有些村镇级的学校,师资匮乏,当地县级学校会发起双师课堂,把课堂影像实时传输给这些村镇学校,让他们可以同时在线上课,与老师互动。然而,由于一些县、镇的网络情况不如一线城市,所以会通过城域网来传输音视频数据,以保障课堂体验。

另一类双师课堂则是由教育培训机构发起的,一方面解决了教育均衡的问题,另一方面则是在一、二线城市教育布局基本完成的情况下,进一步发展三、四线城市。这样的课堂,一般会选择通过互联网或自建专线进行传输,并尽可能地覆盖到更多的学生。

双师课堂的关键挑战

要知道,双师很重要的一个作用是,解决了教育资源分布不均衡的问题。把优质学校或师资,与有需求的学生或师资力量相对薄弱的学校连接在一起,共享优质的课程。可能是同一个国家的老师给学生的上课,也可能是一堂跨洋的课程。

不论是学校,还是教育机构,在建立这样的双师课堂时,都需要面对几个关键的挑战,包括:课堂效果与体验,成本与招生,教学内容的本地化,以及管理等问题。其中,最重要的就是双师课堂的效果与体验。想要获得好的体验,就要面对以下这些挑战。

1. 音视频体验

首先双师课堂是一场多人、多教室共同参与的大型互动场景。而要有互动,最起码就要“看得清,听得清”。但是,双师很多情况下是主要发生在网络环境不同的两个教室之间的。一方是来自一线城市或县级学校,另一方,则是面向一些三线城市,甚至村镇教室,很容易容易遇到带宽的瓶颈。如果强行将高分辨率、高码率的视频传输给他们,很可能会出现视频卡顿、画面丢帧等情况。

在音质方面,教育场景下需要支持语音与音乐的高音质。在语音场景下需要支持8K或16K采样,而在音乐教学场景下则需要覆盖全频带的48kHz采样,这对音频编解码技术方案提出了较高的要求。同时,在教育场景下,还会遇到双讲问题。双讲主要指在交互场景中,互动双方或多方同时讲话,其中一方的声音会受到抑制,从而出现断断续续的情况。这是由于其中一人的声音,被对方的回声所掩蔽。这就要求在回声消除力度上寻找平衡点,既不能产生回声,又不能抑制人声。

通常来讲,双师课堂都是大屏幕互动场景,一般采用 720p 或 1080p,甚至 4K 高清分辨率的视频。这样高质量的音频与视频,会占用较高的带宽。但如果遇到上网高峰或网络拥塞,就会因为丢帧而出现卡顿、模糊、音画不同步等问题。要解决这个问题,需要降低带宽占用,可以通过降低码率或结合机器学习算法来实现。

2. 稳定低延时

在线课堂中,稳定的低延时传输才能保证实时互动可以正常进行。根据国际标准,延时在 400 ms 以内,才能有好的实时音视频互动体验。在选择双师方案时,需要考虑网络节点的覆盖地区是否可以合理满足自身需要,还需要考察其网络服务对中小运营商的支持,以及网络传输质量。

不过,低延时并不意味着越低越好。延时与音视频质量是一对处于天秤两边的参数,延时过低意味着可能要降低一些画质或音质,而高画质、高音质也会占用更高的带宽,提升延时,甚至在用网高峰期会出现卡顿、模糊等问题。

3. 质量可回溯

对于教育行业来讲,主动追查质量问题可以节省大量的运营成本,并有助于提升用户满意度。举一个真实案例。在一场双师课堂里,上课开始时,有一个教室反馈,学生提问,中心教室听不到。在经过一系列诊断和分析后发现,刚刚那个教室其实是不小心按到了静音。于是问题迎刃而解。所以我们认为能提供实时通信服务还不够,还需要将服务质量透明化,让大家可以主动查询出质量问题的根源。

声网Agora双师课堂解决方案

声网Agora 的双师课堂解决方案,基于声网Agora SD-RTN™全球实时网络,提供面向全球的高质量、低延时双师课堂互动体验。同时,双师课堂解决方案支持公有云、混合云部署,既可满足私有云部署的要求,又可通过公用云实现与区域外名校共享教育资源。

双师课堂解决方案可提供高质量的音视频体验,并支持多项课堂互动工具,能帮助老师营造更沉浸的师生交互体验。另外,双师课堂解决方案还支持 AI 辅助教学、质量监控等多项特性。

专线级的传输质量

以往,在线课堂为了保证网络传输质量,尤其是在三、四线城市的课堂效果,会选择搭建专线。但是自建专线成本高昂。声网Agora SD-RTN™ 用互联网的网络成本实现了专线级的传输质量,并将它以PaaS的形式开放出来,为在线教育企业减轻基础建设的高额成本。

声网通过自建的全球虚拟实时通信网络SD-RTN™、自主研发的音视频编解码器和网络传输策略等独家技术手段,可以做到在实时音视频过程中,根据网络情况,智能调节码率、帧率,保证即使在60%的丢包情况下,音视频通话可流畅进行。

音视频高清体验

声网支持1080P 60 帧高清视频,甚至 4K 超高清分辨率,可以保证学生在长时间观看屏幕时,眼睛不至于疲劳。为了帮助用户在低带宽情况下,仍能看到高清的视频,声网还支持超分辨率,让视频能以较低的分辨率进行传输,在到达客户端之后,通过超分辨率算法实时转换为高分辨率视频。

为了可以帮助用户节省带宽资源,声网 SDK 支持 H.265。同等质量的视频,相比 H.264 可节省一半带宽资源。同时,基于声网自研的感知视频编码技术,可以在不损失图像质量的前提下,优化编码性能,并降低15% - 25%的网络带宽占用率。

在音频方面,声网Agora可提供 20kHz 高频谱,远高于市场上常见的 8kHz 频谱,可以提供更高保真度的声音。在国际标准中,统一使用 MOS 值(平均主观意见分)来评价系统接收到的经过压缩后的语音质量。声网提供的HD 音质音频服务,MOS 可达 4.7 分。

传统的双声道立体声是将音频发给特定的、预定义的扬声器阵列,在静态场景能够提供好的服务,但声场转换时将会遇到限制。声网 SDK 还针对双讲现象,进行了特别优化,并融合声网Agora语音引擎与AI音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,避免噪声干扰,可以保证老师的授课不会因为远端学生的声音而收到影响。

另外,声网支持采用硬件编解码,对 Intel、NVIDIA 等芯片进行了兼容,可有效降低音视频性能消耗,让一些老设备也能轻松升级至 1080p 画质。

实时质量监控

除了专线级的网络传输、音视频质量,声网 Agora 双师课堂解决方案还通过「Agora水晶球」提供了端到端全链路的质量监控数据。开发者可将restful api集成到双师课堂管理平台,在平台中实现对每个教室的音视频体验的数据监测和分析。目前,可监测的音视频体验相关数据包括:

  • 设备状态,包括系统 CPU 的使用率

  • 主讲本地采集和听课端播放音量

  • 音视频发送/接收码率

  • 视频发送/接收帧率

  • 视频接收分辨率

  • 视频上行和端对端的丢包率

  • 音视频卡顿情况

  • 用户行为,比如静音、离线等

以上数据信息,开发者均可在「水晶球」中看到。

白板及互动答题

声网 Agora 双师课堂解决方案除了支持常用的白板,还支持互动答题功能。

AI 辅助教学

目前,很多教育平台开始引入 AI双师教学。一位线上老师远程授课,一位线下教师同步答疑的教学模式,同时AI引擎在线上辅助,增加人脸识别、情绪识别和肢体分析。声网 Agora 双师课堂解决方案同样可提供 AI 辅助教学功能。

支持接入多种教学系统

在线课堂还需要接入许多辅助教学系统,比如题库、教学管理系统、资源管理平台等。声网 Agora 双师课堂解决方案支持对接各类辅助教学系统。

另外,声网 Agora 双师课堂解决方案还支持更多特性,可降低开发门槛,满足不同能力开发团队的需求,包括支持美颜、Electron、H5 直播等。

目前,声网已经推出了一站式教育解决方案、AI 互动课堂解决方案等,面向多种教学场景。声网服务的全球客户包括小米、陌陌、完美世界、阿里游戏、The Meet Group(美国最大的婚恋社交平台)、Hike Messenger(印度“微信”)、musical.ly(北美短视频平台)、LisPon(日本二次元音频社区)、Stager Live(日本直播平台)等。