Skip to content

澎湃新闻路由存在多余的图片和音频,界面新闻路由正文出现重复图片 #21681

@HamadaMasatoshi

Description

@HamadaMasatoshi

路由地址

/thepaper/featured
/thepaper/sidebar/:sec?
/jiemian/lists/:id

完整路由地址

/thepaper/featured
/thepaper/sidebar/editorHandpicked
/jiemian/lists/72
/jiemian/lists/280
/jiemian/lists/426

相关文档

https://docs.rsshub.app/zh/routes/thepaper
https://docs.rsshub.app/zh/routes/jiemian

预期是什么?

移除新闻正文没出现的元素和不必要的元素,减少服务器资源消耗,优化文章排版,优化订阅源不同阅读器的兼容性

实际发生了什么?

根据订阅源代码和在某些阅读器渲染订阅源的情况,发现澎湃路由读取了澎湃新闻正文不存在的图片。查看电脑版页面和手机版页面,并对订阅源中的信息做对比,发现澎湃路由是误读取了新闻列表页面在手机版网页和电脑版网页显示的缩略预览图。


Image


另外,澎湃路由几乎每篇文章的附件都有 mp3 文件,这是澎湃电脑版网页提供的“听全文”功能,手机版网页没有。而且这些音频实际都是 AI 读的,意义不大,还会导致某些阅读器把这个路由的订阅源当作 podcast 来处理。


Image


关于界面新闻,存在正文图片与文章头图重复的情况,原始网页是没有正文中的图片的。

Image Image

部署

自建

部署相关信息

No response

额外信息

这不是重复的 issue

  • 我已经搜索了 现有 issue,以确保该错误尚未被报告。

Metadata

Metadata

Assignees

No one assigned

    Labels

    RSS bugSomething isn't working

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions