### Before Asking 在提问之前 - [x] I have read the [README](https://github.com/alibaba/data-juicer/blob/main/README.md) carefully. 我已经仔细阅读了 [README](https://github.com/alibaba/data-juicer/blob/main/README_ZH.md) 上的操作指引。 - [x] I have pulled the latest code of main branch to run again and the problem still existed. 我已经拉取了主分支上最新的代码,重新运行之后,问题仍不能解决。 ### Search before asking 先搜索,再提问 - [x] I have searched the Data-Juicer [issues](https://github.com/alibaba/data-juicer/issues) and found no similar questions. 我已经在 [issue列表](https://github.com/alibaba/data-juicer/issues) 中搜索但是没有发现类似的问题。 ### Question DataJuicer 1.2.0 基于 Ray 1.40.0 构建的 RayData Pipeline(OCR->AES->OptFlow) 会有稳定复现的 长尾视频处理, 我尝试过将输入 JOSNL 的条目按照切片大小排序, 但仍能明显观测到某一张卡最后单独持续运行了很久. 请问这种场景下如何做性能优化? ### Additional 额外信息 _No response_
Before Asking 在提问之前
I have read the README carefully. 我已经仔细阅读了 README 上的操作指引。
I have pulled the latest code of main branch to run again and the problem still existed. 我已经拉取了主分支上最新的代码,重新运行之后,问题仍不能解决。
Search before asking 先搜索,再提问
Question
DataJuicer 1.2.0 基于 Ray 1.40.0 构建的 RayData Pipeline(OCR->AES->OptFlow) 会有稳定复现的 长尾视频处理, 我尝试过将输入 JOSNL 的条目按照切片大小排序, 但仍能明显观测到某一张卡最后单独持续运行了很久. 请问这种场景下如何做性能优化?
Additional 额外信息
No response