• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

android - 使用正则表达式解析 HLS m3u8 文件

[复制链接]
菜鸟教程小白 发表于 2022-12-9 06:49:46 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题

我想解析 HLS 主 m3u8 文件并从中获取带宽、分辨率和文件名。目前我正在使用字符串解析来搜索字符串以查找某些模式并执行子字符串以获取值。

示例文件:

#EXTM3U
#EXT-X-STREAM-INFROGRAM-ID=1,BANDWIDTH=476416,RESOLUTION=416x234
Stream1/index.m3u8
#EXT-X-STREAM-INFROGRAM-ID=1,BANDWIDTH=763319,RESOLUTION=480x270
Stream2/index.m3u8
#EXT-X-STREAM-INFROGRAM-ID=1,BANDWIDTH=1050224,RESOLUTION=640x360
Stream3/index.m3u8
#EXT-X-STREAM-INFROGRAM-ID=1,BANDWIDTH=1910937,RESOLUTION=640x360
Stream4/index.m3u8
#EXT-X-STREAM-INFROGRAM-ID=1,BANDWIDTH=3775816,RESOLUTION=1280x720
Stream5/index.m3u8

但我发现我们可以使用这个问题中提到的正则表达式来解析它: Problem matching regex pattern in Android

我对正则表达式没有任何想法,所以请有人指导我使用正则表达式解析它。

或者有人可以帮助我编写正则表达式以从下面的字符串中解析出 BANDWIDTH 和 RESOLUTION 值

#EXT-X-STREAM-INFROGRAM-ID=1,BANDWIDTH=476416,RESOLUTION=416x234



Best Answer-推荐答案


你可以试试这样的:

    final Pattern pattern = Pattern.compile("^#EXT-X-STREAM-INF:.*BANDWIDTH=(\\d+).*RESOLUTION=([\\dx]+).*");

    Matcher matcher = pattern.matcher("#EXT-X-STREAM-INFROGRAM-ID=1,BANDWIDTH=476416,RESOLUTION=416x234");
    String bandwidth = "";
    String resolution = "";

    if (matcher.find()) {
        bandwidth = matcher.group(1);
        resolution = matcher.group(2);
    }

将带宽和分辨率设置为正确的(字符串)值。

我没有在安卓设备或模拟器上试过这个,但是从你发送的链接和安卓 API 来看,它应该和上面的普通 java 一样工作。

正则表达式匹配以 #EXT-X-STREAM-INF: 开头并包含 BANDWIDTHRESOLUTION 后跟正确值格式的字符串.然后这些在反向引用组 1 和 2 中被反向引用,以便我们可以提取它们。

编辑:

如果 RESOLUTION 并不总是存在,那么您可以将该部分设为可选:

"^#EXT-X-STREAM-INF:.*BANDWIDTH=(\\d+).*(?:RESOLUTION=([\\dx]+))?.*"

在仅存在 BANDWIDTH 的情况下,resolution 字符串将为 null

编辑2:

? 使事情成为可选项,而 (?:___) 表示被动组(相对于反向引用组 (___)。所以它基本上是一个可选的被动组。所以是的,它里面的任何东西都是可选的。

. 匹配单个字符,* 表示它将重复零次或多次。所以 .* 将匹配零个或多个字符。我们需要这个的原因是消耗我们匹配的东西之间的任何东西,例如#EXT-X-STREAM-INF:BANDWIDTH 之间的任何内容。有很多方法可以做到这一点,但 .* 是最通用/最广泛的一种。

\d 基本上是一组表示数字的字符(0-9),但是由于我们将字符串定义为 Java 字符串,因此我们需要双 \\,否则 Java 编译器将失败,因为它无法识别转义字符 \d(在 Java 中)。相反,它会将 \\ 解析为 \ 以便我们在传递给 Pattern 的最终字符串中获得 \d构造函数。

[\dx]+ 表示0-9x<中的一个或多个字符(+)/[\dx\d] 将是同一组字符中的单个字符(没有 +)。

如果您对正则表达式感兴趣,可以查看 regular-expressions.info或/和 regexone.com ,在那里你会找到所有问题的更深入的答案。

关于android - 使用正则表达式解析 HLS m3u8 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15265876/

回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注0

粉丝2

帖子830918

发布主题
阅读排行 更多
广告位

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap