# Daily Record
# 2024 - 第 25 周
# 6.20
重新设计了全局资源表的控制逻辑,将所有资源项改为智能指针用于自动释放资源,同时以参数为单位实现了资源增 / 删能力,对全局资源表的控制能力更强了。
# 6.19
今天突然发现不是所有 syscall 都有用户态的封装,所以需要将原本的用 dlsym 找函数地址直接执行的方式改为用 dlsym 找到 syscall 的地址,然后用系统调用号的方式执行。
# 6.17-6.18
进度缓慢,重构下变异策略,原本是分类型变异,后面看了下 syzkaller,决定也采用数组变异的逻辑,整体会更加统一一些。
# 2024 - 第 24 周
# 6.14
整了下 qemu 和网络接口,做成了一个镜像用于后续的测试。调整了下 fuzzer 的通信逻辑,现在离最小可用只差变异算法、随机数序列生成和覆盖率收集了,下周搞完!
提醒自己一下,syzkaller 的代码和 pcnet32 都还没搞,论文也没怎么看,后续要再调整下学习的整体节奏了。
# 6.12-6.13
由于本地只有 16G 的内存而 CLion 开发又太吃内存了,导致电脑经常卡顿,于是开始将整个项目迁移到云端进行开发,相比于过去的开发方式(本地编辑,上传到云端编译 & 调试),这次直接采用了 CLion 的远程开发功能,相当于用 SSH 直接在远端开发 + 编译运行,可以充分利用远端大内存的优势,体验丝滑很多。不过在迁移过程中确实踩了非常多的坑,浪费了很多时间。
# 6.11
实现了参数间的关联功能,参数可以直接依赖关联关系获取 size,但是这个功能实现起来还是比价复杂的,得再好好设计下看怎么能更加优雅的实现。
# 2024 - 第 23 周
# 6.7-6.10
端午假期期间有点事在忙,没有顾上开发,不过还是抽空继续想了下参数的关联细节。
# 6.6
设计并实现了变异时的映射逻辑,在实现过程中发现了目前的动态交互逻辑稍微有点问题,无法处理出错的情况,后续还需要优化调整一下。同时目前还没有设计 syscall 对资源的控制逻辑,无法判断资源添加和释放的时机。
# 6.5
统一优化了下 socket 交互逻辑和输出展示,现在可以 colorful🌈的输出信息了,虽然是一小点改变,不过体验却清晰了很多!以及决定既然后续是一直研究内核 fuzz,那么内核 fuzz 的开山之作 syzkaller 肯定是绕不过去的,所以决定写一个系列文章,认真分析下 syzkaller 的代码和具体的实现,目前暂时给自己定一个两周的期限吧,加油💪!
# 6.4
重构了项目文件,学习了下 CMakeLists 的编写和 CMake 的应用,这个还是值得记录下的。
# 6.3
转博考核结束了,也已经开始完全跟着新的导师投入到喜欢的软件安全领域进行研究了,从今天开始要开始保证每日更新这篇学习日记了,一定要坚持✊!
今天实现了系统调用所需资源的远程创建和返回的功能,其本质是地址到字符串的相互转换,需要 fuzzer 要能理解所需参数是「值」还是「指针」。
# 2024 - 第 10 周~第 22 周
# 5.3~6.1
除了偶尔有些本子的插曲,耽误几天时间外,基本都在设计自己的内核 fuzz 工具。中间穿插转博面试和导师更换,截止到 6 月 1 号,就开始沉浸式的开发了,写代码确实挺爽的,不过就是被 C++ 的多态折腾的不轻。
# 4.14~5.1
继续做实验 & 写代码,不过进展不多..
# 4.11~4.14
不幸流感,养病中 555...
# 4.1~4.10
完全投入在一个项目中,没有什么多余的时间学习
# 3.9~3.31
四条主线,LLVM、AFL、Linux 内核和论文实验,基本每天都干到 11 点多,最短的一天手机使用时间只有 52 分钟,太牛逼了。
需要注意的是一直在赶着做任务,总结和反思做的比较少,相应的博客更新也落下来了,要注意调整节奏!
# 2024 - 第 10 周
# 3.4~3.8
这一周发生太多事情了,除了继续在白皮书上花费一些时间来完成整体格式、引用的校对外,继续在看论文想办法丰富自己的想法外,又有了新的任务,需要去了解 llvm 和 linux 内核相关的知识。任务量确实大了很多,不过也很充实,真不错。
# 2024 - 第 9 周
# 2.29~3.1
用数学语言重新严谨的描述了一遍问题后,又跟老师重新聊了一下,终于是基本得到认可,可以开始实验了,不过最好还是再丰满一些,所以还需要继续看一些论文。
# 2.27~2.28
基本是在认真的读论文,精读了两篇论文,终于有点感觉了。明确了一条主线后再看论文就很有感觉了,很自然的能找到看的重点,状态非常棒!
# 2.26
同老师聊了一下想法,发现有太多 “不科学” 的地方,整体想法缺乏严谨的数学表述,也没有考虑到边界条件,根本没法形成成为一个科学问题。不过好消息是找到了一篇方向极其一致的论文,就开始认真的研究,真棒!
# 2024 - 第 5 周~第 8 周
# 2.20~2.23
又花了几天时间调试了一下,发现确实是因为多了网络联合训练的时候梯度消失了,最终经过修改,可以成功 train 起来了,但是仍然降低的非常慢,需要重新设计 loss,不过至少从结果上看想法是可行的。
# 2.1~2.19
放寒假期间忙各种事,间断的看了下机器学习的课程,李宏毅老师讲的确实非常好,2023 年的课程全面改版,主要讲了大语言模型和图片生成的内容,深入浅出,受益匪浅。
# 1.29~2.1
机器确实是学起来了,但是 loss 一直不降低,考虑是训练过程中哪里梯度消失了,一直在改网络架构。
# 2024 - 第 3 周~第 4 周
# 1.15~1.19
主要是进行白皮书的修改工作,整体节奏比较放松。
# 1.22~1.26
在继续补全白皮书的基础上,对想到的研究方向进行探索,一周的时间基本完成了代码的编写,已经能跑起来了,不过部分 bug 还需要进一步修改一下。
# 2024 - 第 2 周
# 1.9~1.12
主要是论文的阅读来为白皮书的书写做储备,偶然间用 GPT 的时候带给了我一点启发,其实也算是回答了我之前一直想的一个问题:在看语义通信安全相关的一些论文时,总会有一种生搬硬套的感觉,论文的核心内容其实就是将已有技术套了一层语义通信的壳子;就拿加密来说,我个人认为在训练模型时加入额外的层数来完成加密功能,和直接用已有的加密算法对语义特征进行加密其实没有什么区别,本质上其实没有利用到语义通信系统中的 “特性”,我认为应该存在更好的结合方式,能让语义通信中的加密区别与传统加密。
确实是有的,目前我的启发是给加密提供额外的语义信息,能让加密变得 “智能”。举一个简单的例子:“按需加密”。由于语义通信中,模型具有理解语义的能力,所以模型有了 “分辨隐私信息” 的基础,那么有别于传统加密需要对整个消息进行加密的低效,语义通信加密可以只对必要的信息加密,且可以很好的适应多模态任务。我觉得这是一个非常好的结合方式。
# 1.8
完成考试的第一周,基本完成了区块链的大作业,阅读的论文还是很有意思的,区块链的天然公开性和其源代码的健壮性存在一定的冲突,对代码质量有了更高的要求,论文中 “模仿攻击” 的思路也非常有趣,值得再细想一下。
# 2023 - 第 52 周~第 54 周
几个主线轮番执行:复习期末考试、帮学长测本振、大作业。整体没有太多可以沉淀的地方,就不过多记录了。
# 2023 - 第 51 周
# 12.11-12.15
沉浸式代码迁移~最终耗时一周完成了,不过还是有一些问题,loss 不是很对,但是整体训练过程应该是一样的,留待后期仔细对比一下吧。
# 2023 - 第 50 周
# 12.7-12.8
做了两天 PPT,本学期的最后一次了,nice~
# 12.4-12.6
调了一下 tensorflow 的 bug,后续还要进行从 tensorflow 到 pytorch 的代码迁移工作。从查到的资料来看,tensorflow 的整体生态确实感觉也不够良好,一些 bug 的讨论最终的解决方案不够好,从 tf 到 pytorch 的迁移还是很有必要的。
# 2023 - 第 49 周
# 11.28-12.1
通过读论文有了诸多想法,但其实只是简单的想法的萌芽,整体思路其实并没有想的特别清楚,老师也给出了一些提点。不过其实回顾点点滴滴,从我自身的状态来看,其实最大的问题还是还没开始,想法很多,进度却很慢,有些东西一直都没有继续前进,导致了眼高手低,所以,最终送给自己的忠告还是:知行合一!
# 11.27
改 PPT and 作业展示耗费了所有的时间,不过应该是最后一天了,明天可以有时间读读论文了
# 2023 - 第 48 周
最忙的一周,没有之一,周末考试,好好复习!
# 2023 - 第 47 周
# 11.15-11.17
基本是在沉浸式的看论文,记了很多疑问,要一一解决!
# 11.13-11.15
更换了方向,开始做语义通信相关的东西,认真看论文中。第一遍中出现了很多不理解的点,希望这周内全部解决~
# 2023 - 第 46 周
# 11.8-11.10
找到了一本讲解授时技术的书:《量子时频传递技术》陈星编著,然后就一直在看书了,收获很大~
# 11.6-11.7
上课 & 希望今天要把授时图画完。
# 2023 - 第 45 周
# 11.1-11.5
上课 & 发烧基本啥事都没干,哎
# 10.30-10.31
上课 & 写作业,学习了 IRIG-B 的含义和结构,IRIG-B 广泛应用于卫星和光纤中,还是非常有用的。明天要搞清楚 TDEV、MTIE 和 ADEV 的原理!
# 2023 - 第 44 周
# 10.27
记住:什么都懂一点并不值得骄傲,只有在某一领域有深入研究、有成果的基础上,才是优点。
# 10.26
彻底搞清楚了光纤通信的基本原理和波分复用技术的原理,明天继续看 IRIG-B 编码!
针对昨天提出的 “劣币驱逐良币” 问题,进一步思考了一下,希望能系统的总结成文章~
# 10.25
主要时间都在鉴别礼物,另外学了一点光纤授时中涉及到的一些原理如光纤通讯、波分复用技术等,不得不说,在现在这个时代,买东西想不被骗对于购买者真的是一个很高的要求,100 元的东西,10 元原材料、90 元营销宣发照样可以赚的盆满钵满。过去酒香不怕巷子深、踏踏实实做东西的认知已经过时了,现在这个时代,关注短期利益、赚一波钱再换个商标继续赚钱就可以了。监管不严、惩罚力度小,最终都成了劣币驱逐良币的最佳土壤!哀哉!哀哉!
# 10.24
电脑莫名其妙的更新了系统,导致诸多软件不兼容,上午就在处理各种 bug,下午继续学习了机器学习的课程,明天更新 “正则化” 的知识。
# 10.23
除了上课之外的时间都在踩坑,终于是在今天内选择出了一套完整好用的论文编写和管理方案,总结成博客后就可以继续向前了!
# 2023 - 第 43 周
# 10.20
上课 & 做 PPT,然后就没有时间了,但是对未来的研究方向有了突破口,还是非常激动人心的!
# 10.19
整整一天的课,不过还是猛猛抽时间完成了机器学习的第一个大作业,芜湖!
# 10.18
今天有大量时间,在看机器学习的第一个作业:新冠病例预测,透过大作业去学习学的还是挺快的,状态也不错,跟学长的交流也很有收获,真是幸福的一天~
# 10.17
基本一直在看网课,网课还是挺长的,目前看的进度有点慢,计划努努力,尽快开始第一个练习,希望能从问题中反驱学习。
# 10.16
由于在入门机器学习,就想着先找个感兴趣的项目下载下来玩一玩,看看大概是什么样的,最终在处理了两天 bug 后觉得可以放弃了,就以现在手中这台 Mac 的能力,完全不支持自己训练模型,不如老老实实的看网课,做一些配套的练习题实在。
# 2023 - 第 42 周
# 10.13-10.15
搜集了很长时间资料,跟老师聊了一下才发现思路完全是错的,正确的思路应该是:
- 考虑过去做的事情的经验
- 考虑现有的资源
最终汇总成 2~3 个方面,从中选择感兴趣的方向。另外还有两点问题需要反思:
- 更多的跟学长学姐们交流自己不明白的地方,不要包装用词
- 要踏踏实实的做科研,不能对未来过于乐观,不能认为时间还有很长,要聚焦于短时间(两年)内能做的事
# 10.12
基本完成了数理统计大作业了,还剩一点点小尾巴,明天可以很快弄完。
导师又找我聊了聊授时和研究方向的问题,聊了很长时间,收获也很大。记录一些我认为的要点:
- 批判性读论文。其实读论文不带脑子的问题我在 9.25-9.26 中提出了,但还是比较模糊,会有种「因为自己不了解相关知识,于是就把所有都当成 “定理” 去接受了」这样的认知,今天看了老师读论文的笔记后,我突然意识到,上述说的并不构成理由,恰恰是因为没有批评思维,才会觉得读起论文来知识体系非常模糊。提出问题其实不是一定提出 “真实的问题”,而是 “自己的问题”,正是这些问题,这些疑问才能促使思考,为信息收集该如何扩展指明方向。
- 知识收集要从博客转向论文。我认为是惯性问题,但是也必须要改变才可以。除了惯性外,英语阅读能力也需要提升。
- 倒着想时间 & 规划。老师确实否定了我很快发论文的想法,但也给了很好的时间参考。我现在暂时把目标定为这一学期内能发第一篇论文的初稿,那按时间倒推,留半年时间写论文的话,我就需要在这学期选定方向、定下论文思路、完成数学推导了。时间很紧张,留给我定方向的时间不多了,请在下周内至少完成粗略领域筛选,最好完成细分领域的筛选。
- 选择感兴趣的方向。但我认为,选择感兴趣的方向其实稍微有点伪命题的意思,最佳选择其实不是最感兴趣的方向,而是
兴趣 + 前景 + 知识背景
三者的综合最优。所以我暂时想到的寻找办法是:- 先确定搜索的范围,一定是顶刊(只局限安全的顶刊?还是包括非安全领域?)
- 按领域进行分类,类内按引用数进行排序
- 粗看论文,大致搞清楚各个领域的研究边界(3-6 个好像都可以接受)
- 综合自己的特点和背景,确定自己感兴趣的领域(1-2 个)
- 批判性的找综述类的论文来读,了解该领域下的细分方向,二次确认 “兴趣” 领域(1 个)
# 10.11
学习了 Monte Carlo 算法,看懂了大作业题目 hhh,写了一部分大作业,明天又是一天课,能写完我就知足了。
# 10.10
把之前草草看过的机器学习的笔记做了一下,在这次笔记记录过程中发现了一个问题,有太大量的篇幅是对原文的摘抄或翻译,做笔记的目的不是为了重复劳动,而应该是促使自己思考的,所以在下一次的笔记中,一定要注意这一点,把知识揉碎了形成一个整体再去形成自己的笔记,这样才会有收获。
# 10.9
上课狗,抽时间做组会分享的 PPT,好多 qaq,今天一定要做完!
# 2023 - 第 41 周
# 10.3-10.8
一直头痛,就没有更新了,顺便说一句,学校不补课真是太 coooooool 了~
# 10.2
基本搞懂了极化码的原理,尝试着继续看论文。
# 2023 - 第 40 周
# 10.1
越学学多,深度优先搜索还没有收敛,已经追到信息论的知识了,明天补一下,希望能回到论文继续看。
# 9.30
完成了时间的分发部分,具体细节没有追的特别细,公式基本看懂了。
# 9.29
小学了一会儿,大概弄懂了授时中时间是怎么产生的了,还是很不错的,明天继续!
# 9.27-9.28
课程加党日活动把时间占的很满,没有太多时间可以学习自己东西,抽时间完成了科协第一课的 ppt,还有 1000 字的思想汇报和论文精读,本来想着国庆能摆一摆,真实情况是可能得加班加点的学习_
# 9.25-9.26
上课连着组会,其实没有太多时间干自己的事,主要是继续读论文;在组会分享中发现了一些问题,需要尽快解决:
- 怎样读论文?重点注意哪些?在泛读时需要达到什么程度?
- 要注意知识的背景,将整个授时的过程研究明白
- 在读论文时一定要带着脑子读,多提出问题。
# 2023 - 第 39 周
# 9.22
周末接着读了论文,然后提前回家了~小摆一下
# 9.21
今天真一天课,本来想利用空闲时间搜一下论文做脑图,结果学校的光纤被挖断了,看不了论文,被迫更新了操作系统的第五章 QAQ。
# 9.19-9.20
上课 & 找论文资料,经过一番搜索初见端倪,大概理解授时技术到底是在干嘛了,关键词也从 PNT timing security
-> time protocol security
-> timing synchronization security
,基本找到想要的内容了。
另外还完成了操作系统第四篇文章的代码 Debug,只能说,因为 include 顺序导致的编译错误这种 bug 真的想象不到,还浪费时间,可恶!
# 9.18
非常充实的一天,忙到 12 点才睡,上了一天课,又抽时间帮学弟学妹们完成了面试复盘,明天开始正式迈入科研生活,任务:寻找论文资料并完成研究现状、安全挑战两块内容。
# 2023 - 第 38 周
# 9.15
继续被上课和预算填满,抽时间继续更新了资源导引页,新增了「搜寻学习资源」的类目,这里面的网站真是我不愿说出的信息差,不过呢,即然都说了「开发共享」,又怎么能有所保留呢?
同样给自己留一个思考题:目前本页的更新中,由于每天记录内容其实很短,反倒是标题占用了大多数的空间,信噪比太低了,要考虑要不要优化一下格式了。
# 9.14
上课!好多课!其余时间都在整资源页,终于小具规模,还是很有成就感的,希望能帮助到一些人,这里补一下想做但还没有做的分类:图书推荐、安全资讯平台汇总、赚点外快....(暂时先这么多)
# 9.13
上午上课加忙预算,下午完成了 Mac 下 gdb 的安装,真不戳~
# 9.12
一整天都在重新调整整个预算表格的格式,估计是要熬夜才能改完了 Orz
# 9.11
上了整天课,课上又没发干自己的事,完全没有时间做其他的事情🥺
# 2023 - 第 37 周
# 9.9-9.10
周末好好玩~
# 9.8
Debug 中,操作系统好难调试,没有办法进行指令调试,只能插值来调试,去了解下怎么用 qemu 做调试?留个小任务,去学着调试下吧。
# 9.7
终于有时间做自己的事情了,上午修复了一下博客的评论 bug,为静态资源配置了 cdn 加速;下午看了会儿塔式服务器(万一用上呢!),然后继续修改部分预算问题并继续进行操作系统的更新,完成了保护模式的部分。
# 9.6
上午完成了预算的初稿,下午去找了财务的老师核对各项问题,晚上还挺有状态的完成了操作系统的 GDT
和保护模式的部分内容,还不错~明天要把~~ loader
~~ 保护模式写完进入虚拟内存的章节啦
# 9.4-9.5
预算工作第一版接近尾声,一定要把第一版写完,明天开始继续操作系统
# 2023 - 第 35-36 周
# 9.2-9.3
周末基本在学校活动、应酬、改预算之间度过,操作系统 0...
# 9.1
操作系统进度缓慢,明天尽量把预算弄完,然后好好学操作系统吧
# 8.31
接触了点项目预算编写的知识并编写了一份财务预算说明书,抽了一点时间给操作系统的第四篇文章开了点头,希望两天内能完成第四章吧,加油!
# 8.30
开学报道~参观了一下学校,体验了食堂,还是很不戳的~
# 8.27-8.29
又是当懒狗的一天,摆了很长时间,好在迷途知返,抽了点时间看操作系统~
# 8.25-8.26
抽空回家进行了各种档案工作,陪陪家人,基本摸不到电脑...
不过还是利用一点点时间把操作系统第 3 章完成了✌️
# 8.24
难得休息,打了打游戏,出去应酬了一圈,就没有进行学习任务 (爽~
# 8.23
终于,项目结束了,可以好好休息一下了,幸福到流泪😭
上午完成了 baidu、google、bing 的 SEO 索引,等待一天时间就可以看分析数据了,可以通过改善关键字来提升 SEO 排名,既然准备好好经营,为什么不让更多人看到呢😊
必须吐糟一下,baidu 的这个站长工具真的垃圾,google 3 分钟就配好了,就这个百度,用站长工具还需要实名认证,实名认证就算了,还需要扫脸,牛
下午接着完成 mbr
编写的剩余部分的内容,还是剩一点点小尾巴没有完成,有一点点可惜,留着明天完成吧~😁
# 8.22
整体效率还行,完成了博客的 aligolia 的搜索配置,完成了操作系统从 0 到 1 的第二篇文章,第三篇开了个头,使用 figma 作为画图工具还是有些大材小用了,浪费了点时间,需要找一个功能更简单、更便捷的画图工具!
# 8.21
今天效率极低,只完成了操作系统序言部分的编写还大多都是借鉴别佬的,感觉稍微有点浮躁,没有沉下心,倒是听了很多财经的科普 hhh,明天要调整下状态好好学技术~
# 2023 - 第 34 周
# 8.20
继续处理博客的遗留问题,包括:
- 精选分类封面图片无法加载
- 主题特殊样式学习
- 主题样式的一点点 bug 的修复
- comment 表情包引入
- 默认模版更新
其实都是小问题,中间由于要调 bug,也去学习了一点 Nunjunks
和 stylus
语法,对于 hexo 的实现和现在使用的主题的实现都有了一定了解,可以更好 DIY 了😁
对于博客的改动基本进入尾声了,之前预留的待踩坑项也都完成的七七八八了,后面就要注重内容的填充了,冲!
# 8.18-8.19
虽然是偷偷摸摸,但终算有点时间打理一下博客,完成了博客配色的改变、评论管理系统搭建、图床的适配等等,基本将博客的整体架子搭出来了,后面就算再加,也只是功能的完善、调整或新增。现在其实更重要的是把博客的内容丰富起来了,加油!
今天反思了一下过去写博客的经历,仔细想想其实之前也有过坚持日更坚持一年的情况,但是随着电脑的更换、服务器的到期最终连记录都已经找不到了,确实有点可惜,希望这次依托 github 可以将数据永久保留,使得我可以再走了很久之后可以回头看看自己来时的路。
# 8.17
情况稍有转机,工作内容有了变化,可以使用自己的电脑了,做了 4 个 1day 的漏洞复现,也算是有些收获吧,顺便开始回忆起了一点点 web 手的记忆 hhh~
# 8.14-8.16
本来雄心壮志且状态在线的立刻开始记录每日的学习,但实际上却被外部条件无奈的阻止了,迫不得已暂时停止开始坐牢...