DualAxisRM

This repository contains training utilities for DualAxisRM.

Overview

The code evaluates spoken dialogue along two axes:

Response Relevance: whether the reply is logically consistent and topically appropriate
Interactional Fluency: whether turn-taking is natural, including long pauses and extended overlap

The final label is binary:

0: poor interaction
1: strong interaction

Repository Layout

DualAxisRM/
├── examples/
│   └── data/
├── scripts/
├── src/
│   └── dual_axis_rm/
└── tools/

Installation

pip install -r requirements.txt
pip install -e .

Data Format

Each input line in examples/data/source.example.jsonl follows this schema:

{
  "audio": "relative/or/absolute/path/to/dialogue.wav",
  "overall_score": 0,
  "response_think": "The response stays coherent and answers the previous turn directly.",
  "fluency_think": "Turn-taking is natural, with no harmful overlap or long silence."
}

Build SFT data:

python tools/build_dataset.py \
  --input examples/data/source.example.jsonl \
  --output data/train_sft.jsonl \
  --mode sft

Build GRPO data:

python tools/build_dataset.py \
  --input examples/data/source.example.jsonl \
  --output data/train_grpo.jsonl \
  --mode grpo

Training

MODEL_PATH=Qwen/Qwen2.5-Omni-7B \
DATASET_PATH=data/train_sft.jsonl \
OUTPUT_DIR=outputs/sft \
bash scripts/train_sft.sh

MODEL_PATH=outputs/sft/checkpoint-xxx \
DATASET_PATH=data/train_grpo.jsonl \
OUTPUT_DIR=outputs/grpo \
bash scripts/train_grpo.sh

Inference

MODEL_PATH=outputs/grpo/checkpoint-xxx \
VAL_DATASET=data/val.jsonl \
bash scripts/infer.sh

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
examples/data		examples/data
scripts		scripts
src/dual_axis_rm		src/dual_axis_rm
tools		tools
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

DualAxisRM

Overview

Repository Layout

Installation

Data Format

Training

Inference

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

DualAxisRM

Overview

Repository Layout

Installation

Data Format

Training

Inference

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages