compiler

1 介绍

这是一个以自动机理论为基础的包含词法分析，SLR1语法分析，语义检查，终端代码生成的C--编译器实现。

2 软件架构

2.1 目录结构

compiler/
├── test/         # 最终验收时收集的正式测试用例可供参考
├── build/                  # 编译时产生的存放编译结果的目录
├── case/                  # 测试用例目录
│   ├── <用例文件>.sy           # 测试用例C--源码
│   ├── <用例文件>_parse_analysis.txt   # 测试用例语法分析过程
│   ├── <用例文件>.parse_tree.md        # 测试用例语法分析树
│   └── <用例文件>_semantic_tree.txt    # 语义分析结果
├── example/               # 自己构建的所有测试sy用例
├── output
│   ├── <用例文件>_lexer_s.txt     # 测试用例词法解析结果(老师要求格式)
│   ├── <用例文件>_parser_s.txt     # 测试用例语法解析结果(老师要求格式)
│   └── <用例文件>_output.ll    # 中间代码生成结果
├── documents/             # 文档目录
|   ├── note.md            # 一些记录
│   └── 2025秋季编译原理大作业.pdf
├── include/               # 头文件目录
│   ├── ast.h        # 目前没有使用，暂存
│   ├── lexer.h           # 词法分析器头文件
│   ├── parser.h           # 语法分析器头文件
│   ├── semantic_analyzer.h     # 语义分析器头文件
│   ├── symbol_table.h    # 符号表头文件
│   └── ir_generator.h     # 中间代码调用头文件
├── ir_lib/               # 中间代码生成外部库
├── logs/                 # 记录每次运行信息的日志目录
├── scripts/               # 脚本和工具目录
│   ├── parser_usage_example.cpp # 用于测试语法分析树获取是否可以被正常调用
│   └── ...         # 其他调试用的测试文件
├── src/                   # 源代码目录
│   ├── ast.cpp     # 目前没有使用，暂存
│   ├── ir_generator.cpp     # 中间代码调用实现
│   ├── lexer.cpp         # 词法分析器实现
│   ├── parser.cpp           # 语法分析器实现
│   ├── semantic_analyzer.cpp     # 语义分析器实现
│   ├── symbol_table.cpp    # 符号表，供ir_generator使用，具体实现在.h文件
│   └── rule.txt          # 文法原始产生式
├── process/              # 分析器构建的输出(文法和词法规则不变就是定死的)
│   ├── first_sets.txt    # 语法分析FIRST集合
│   ├── follow_sets.txt    # 语法分析FOLLOW集合
│   ├── parse_analysis_table.csv    # 语法分析表
│   └── lexer_state_transition_matrix.csv      # 词法分析DFA状态转移矩阵
├── Makefile
├── .gitignore
└── README.md

/ir_lib 库来源 https://gitee.com/happy-traveller/compiler_ir

3 运行启动

3.1 环境准备

1.操作系统

推荐在 Window 10/11 下运行

2.工具

编译：

C++ 编译器: g++ (支持 C++11 标准)

推荐使用 MinGW-w64 或 MSYS2

确保 g++ 在系统 PATH 中，若不配置环境变量，请将 Makefile 第6行的 wildcard 路径改为您电脑的 g++ 路径
构建工具: GNU Make
- Windows 可使用 MinGW Make 或 MSYS2 Make

验证环境

# 检查 g++ 是否安装
g++ --version

# 检查 make 是否安装
make --version

3.2 运行

所有编译产生的结果位于 /build 下

以下仅列出一些常用命令，具体直接看 Makefile 就行

# 编译清理
make clean

# 编译到词法分析器 (lexer.exe)
make lexer
./build/lexer.exe \<可选测试用例文件\>

# 编译到语法分析器 (parser.exe)
make parser
./build/parser.exe \<可选测试用例文件\>

# 编译整个项目(包括中间代码部分的)
make compiler
./build/compiler.exe \<可选测试用例文件\>

# 清除测试结果：清除 /case 下所有非 .sy 文件
make clean-case

# 清除测试结果：清除 /output 下所有文件
make clean-output

# 测试 /case 下所有用例的词法分析部分
make test-all-lexer

# 测试 /case 下所有用例的前端部分
make test-all-parser

# 测试 /case 下所有用例
make test-all-compiler

每次分析会在用例路径也就是 /case 输出：

词法分析 token 解析结果：<用例文件名>_token_result.txt
语法分析过程：<用例文件名>_parse_anlysis.txt
语法分析树：<用例文件名>_parse_tree.md
语义结果：<用例文件名>_semantic_tree.txt
LLVM输出：<用例文件名>_output.ll

每次运行都会将过程调试信息输出至 /logs 目录下

这个目录在 make 时如果不存在就会自动创建
日志文件名按时间戳命名
部分过程表示输出以及语义报错输出到终端

4 开发说明

目前带有 #EXPORT_DEBUG# 的注释下是调用一些输出构建信息的函数，这些构建信息已经预先运行一遍存在 /process 目录下了，如果后续有修改构建需要重新输出，直接查找这个标记取消相应注释就ok了
关于 "main" 这个要求文档上词法分析把这个弄成KW，但是后续分析类型解析成标识符比较好，所以token输出的是KW(给老师看的)，实际上都是按照标识符使用的

5 一些其他说明

5.1 联系方式

zengyicydd@tju.edu.cn

gaocan@tju.edu.cn

daimingjing142857@tju.edu.cn

jsyy@tju.edu.cn

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

compiler

1 介绍

2 软件架构

2.1 目录结构

3 运行启动

3.1 环境准备

3.2 运行

4 开发说明

5 一些其他说明

5.1 联系方式

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 107 Commits
case		case
documents		documents
example		example
include		include
ir_lib		ir_lib
output		output
process		process
src		src
test		test
.gitignore		.gitignore
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

compiler

1 介绍

2 软件架构

2.1 目录结构

3 运行启动

3.1 环境准备

3.2 运行

4 开发说明

5 一些其他说明

5.1 联系方式

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages