avatar

長門有希

信息统合思念体

GitHub Logo Email Logo Atom Feed Logo
首页归档友情链接关于我

序(于2024年)

新年快乐!

今天是大年初一,过去一年,对我们来说是新的开始。从某种层面上讲,人们对科幻作品的关注从来没有像2023年那样热情高涨。我想起我以前也写过一篇科幻(奇幻)类小说,题目是《门》。这篇小说写于2015年,当时除我以外,作者还有另外几人,不过我已经记不清都有谁了,实在是抱歉。今天我想把这篇小说发布在这里,作为年度总结的一部分和新年的第一篇文章。因为内容大部分是我写的,而且也没人在意这些内容,所以应该没有版权上的问题。

以下是正文。

封面

封面

本站已使用SnowbowHandlebars重构

很高兴地宣布,本站已经使用SnowbowHandlebars重构。这是一个基于Handlebars的静态博客生成引擎(static site generator),它的特点是:

  • 良好的i18n支持;
  • 良好的pandoc支持;
  • 良好的handlebars模板支持。

两个星期前我上传了静态词嵌入的总结,这次是上下文词嵌入(contextualized word embedding)的总结,包含一些预训练模型。PPT可以点击此处下载

前言

在NLP领域中,一个重要的问题是如何表示词。在过去,有一些基于分布假说的Static Word Embeddings模型,如Word2vec和GloVe,他们利用词语的上下文分布信息学习每个词的静态嵌入表示,最后得到每个词对应的固定的向量。这种模型的缺点也很明显,第一是不能提现词语的多义性。尽管有一些基于上下文学习一个词对应多个词嵌入的方法,但是这些表示仍然是静态的,不能从根本上处理丰富的词义变化;第二是要将Static Word Embeddings应用到下游任务(例如Named Entity Recognition、Sentiment Analysis)时,还须要设计额外的分类模型,使用RNN或多层CNN再次获得当前的语境信息。

Contextual word embedding模型不再单独训练每个词的表示,而是以语境为单位,每次都输入完整的上下文,输出这些词在当前语境下的表示,并且同一个词在不同的语境中的表示是可变的。这样一方面解决了词语多义性的问题,另一方面通常无需再设计额外的下游任务模型,因为contextual word embedding已支持完整的上下文的输入输出。

本文首先介绍一个常用的特征提取模型Transformer (Vaswani et al., 2017),然后介绍contextual word embedding的训练过程,以及他们的评价方法和结果。

大家好,欢迎来到2022(twenty-twenty too 😉)。

研究生的这一年多来还是挺难过的,疫情是一方面,另外主要是我研一的时候课题组除了导师以外只有我一个学生,没有师兄带我,和其他人的交流也很少。研二的时候新来了一个同学,不过我还没怎么见过他,不像我在新生的时候就开始跟导师读论文写综述了。现在想想,如果我在研一的时候也像他那样,多花精力在课程和生活上,而不是在读论文和写综述上,可能我能更好地适应研究生的生活,少一些痛苦。虽然有人可能觉得研一就进入科研状态挺好的,毕竟积累得早收获得多,但是每周都要写几页综述还要做组会PPT确实给我带来了很多压力,影响了精神状态。

但总之我也确实积累了一些材料,主要是读论文的总结,打算最近整理一下发在博客上。本篇关于静态词嵌入的总结,是我在研一上学期时导师带着写的,每周导师会给我发5篇左右的论文,我阅读之后整理主要内容并写成综述和PPT。网页中是综述的内容,PPT可以点击此处下载。由于我刚接触该领域,可能会有些写得不对的地方,请多批评指正。我也会尽量标注参考文献(目前是ACL会议格式,后续可能会改为链接),如果对某些内容有兴趣,请以原文为准。

以下是正文。

前言

本文将若干篇词嵌入相关的论文组合起来,对词嵌入在各个阶段和层次的发展过程进行了梳理,整理了词嵌入相关的扩展方法和评价方法。

使用systemd部署.NET源码

好久没有写东西了。

这篇文章主要是记录一下如何手动配置systemd服务,尤其是用.NET开发的长期运行的网络服务,并且无需手动编译部署包。

开发.NET服务最优雅的方式莫过于使用Visual Studio写C#,在Windows上无论是编写还是调试都很方便。不过写好之后如何将它部署到服务器上呢?

.NET提供了一些生成部署包的方法,包括生成跨平台二进制文件、依赖框架的可执行文件和独立可执行文件的方法。不过经过我一段时间的测试,发现这些方法还是有些麻烦的,每次更新后都需要手动发布然后上传部署包。而最优雅的方法应当是直接同步代码,然后服务器用SDK直接运行代码。

这里贴上我在服务器上部署的一个.NET服务的配置文件和命令,作为参考。

新建/etc/systemd/system/webmonitor.service配置:

[Unit]
Description=Yuki Web Monitor
After=network.target  # 该服务依赖网络服务,在启动网络服务后再启动该服务

[Service]
Type=simple
User=lighthouse  # 执行程序的user和group
Group=lighthouse
WorkingDirectory=/home/lighthouse/WebMonitor/WebMonitor  # 设置CWD,注意应指向项目(Project)目录而不是解决方案(Solution)目录
ExecStart=/usr/bin/dotnet run  # 如果需要其他参数写在后面即可
Restart=on-failure  # 异常自动重启

[Install]
WantedBy=multi-user.target  # 允许开机自动启动

添加该配置文件后,执行:

sudo systemctl enable webmonitor.service  # 开机启动
sudo systemctl disable webmonitor.service  # 禁用开机启动
sudo systemctl restart webmonitor.service  # 启动、重启动该服务
sudo systemctl stop webmonitor.service  # 停止该服务

先说最终解决方法

执行命令

chcon -Rv -t ssh_home_t ~/.ssh

即可。

问题背景

由于实验需求,管理员分配给了我一台远程主机,并配置了新的用户和密码,ssh用密码登录没有问题,但是我尝试配置公钥登录时,添加了~/.ssh/authorized_keys的内容,却无论如何也不生效。

苏州之行

前几天去了苏州,主要是参加CCF CCSP和CNCC,感觉出去一趟不容易,还是应该记录一下。

原理

基于官方提供的Dockerfile,在Docker中交叉编译。
https://github.com/aria2/aria2#cross-compiling-windows-binary

修改是基于aria2-fast的patch文件。
https://raw.githubusercontent.com/archlinuxcn/repo/master/archlinuxcn/aria2-fast/aria2-fast.patch

前两天刚刚确认自己无法参加EC-final,那么也就说明我大约一年半的ACM生涯就此结束。首先关于这次EC-final名额的问题,本来我们队是申请成功的,但是由于主办方的种种原因,教练出于学校声誉的考量,决定放弃申请的名额。我们队也可以理解,说到底这个名额本来也是出乎我们意料的,只是多训练了半个月,也没什么遗憾。

实际上我参加过较大的比赛只有一场ICPC区域赛、一场CCPC和一场CCPC邀请赛,相对于其他ACMer来说是低于平均水平的,不过最后区域赛打银滚出算是实现了最基本的目标。其实主要是我在大一入学的时候没有规划好大学生活,参加了一些奇奇怪怪的组织,没有集中精力在ACM上。如果我有好好规划的话,可能就可以像sdj那样大二退役,或者多一些时间冲金,或者可以去实习,或者去研究一些更奇怪的东西,总之可以省下很多时间。

在区域赛的时候,队友AC了第五题,已经稳银了,还剩四十分钟。我开始敲第六题,如果AC的话可能在金尾;然而没有如果。赛后我们也一直抱有遗憾,不过还是尽力去做了,也把能做到的都做到了,这几个月的集训我们队各方面都提升了很多,我的队友是我在大学生活中一起经历过最多考验的人。

我在刚参加校队集训的时候,要填写一个报名表,其中有一项是“想达到什么目标”。我写的是“进world final”,后来我才知道swb学长也是这样写的。不过我和他都没能实现这个愿望,而且我比他差得更多。今年CSU的ACM生源更好,有许多参加过OI的大佬,我想应该不出两年这个目标就能实现了。

从高中开始我就一直有参加算法竞赛的梦想。当时是参加“翱翔计划”的时候听老师介绍了清华附中、人大附中等超级厉害的高中同学去IOI参赛的场景,然后我也有了去参赛的梦想,可惜我的高中并没有这种组织。到了大学终于圆了梦想,虽然没有出国,但是也是很有意思的经历。

大学期间,为了ACM我放弃了很多,“ACMer是没有假期的”。但是相对地收获了更多。在赛场上,排除一切杂念的能力,相信自己相信队友的信念,静心阅读英语的心境,都是取得成绩的必要因素。更重要的是平时的付出,每周在机房的十几个小时,积攒AC题目和与队友的配合技巧,以这些一点一滴的付出应对来之不易的比赛机会。

日后谈就到这里,接下来是回忆。

我第一次参加训练是在大一暑假,虽然有很多同学大一寒假就开始训练了,但是我得知消息总是比别人要晚一些。虽然我在高中的时候学过一点C语言,但是其实还是要从头开始,学习C++有哪些头文件,分别要在什么时候引用。相对于那些有OI经验的同学,我对数据结构的理解比他们要差得多,他们都知道栈、队列这些结构在实际应用中要怎么操作,而我就只知道一些概念。不过靠我以前VB调库的经验,还是度过了这段时间。

到了大二上学期,因为我不太清楚学校选择参赛队员的规则,所以我在十一期间回了趟家,导致我没能参加那一学期的ICPC和CCPC。训练时坐我旁边的cdn学长,还有sdj、qt、lfw等同学都参加了。之后cdn和sdj退役,qt、lfw和我继续打。其实如果我去参赛了的话可能也会选择退役;然而没有如果,才有了接下来一年的经历,不知道算不算幸运。

大二下,我参加了CCPC邀请赛,当时和wwk、lfw是队友,拿了我(人生中?)第一块国家级的银奖。

然后是大二暑假,我重新和wwk、wy组了队,每天打多校。多校题比较难,我们几个天天自闭,也提升了很多,把以前模糊的高级知识点都重新梳理了一遍,也开始系统整理个人模板,就是在我博客里的这篇文章

大三上,也就是这学期,我参加了ICPC和CCPC,一银一铜,都多多少少有些遗憾,但是在我们这个层次的选手比赛有遗憾也是正常现象。一年多的训练终于有了成果,也算遗憾不大吧。得知退役后,我们还是打了一场字节跳动网络赛,题目很难,机房里的队伍都是一题,这就是我们的退役赛。

长沙的严寒酷暑总是令人恐惧,如果我在假期能回家的话,大学生活一定比现在要轻松得多。不过即使再给我一次机会,我也一定会选择训练。我深知自己做不成太多事情,实际上大学除了比赛也没有再做什么事情,但是这是我最热爱的事情,也是我认为我做过的最有意义的事情,也是我感触最深的经历。

之后还有半年的时间准备保研,我大概要一边写写项目一边搞搞科研,所以即使退役了也觉得还有事情要做……

我由衷感谢我的队友和其他一起训练的同学。

最后,我把之前几场比赛后写的总结贴上来吧,作为更详细的记录。

悠长的假日

作者:米泽穗信

译者:MUSH

校对:某⑨ DL0617

测试:DL0617 风徽血忆 木子水100 qwe111day 空之晴翾 _____死角 旗木泡泡子

日文原文载于《野性时代》120号(2013.10) 角川书店

三年

为什么人不能知道未来的自己在做什么,甚至也经常不知道以前的自己想过什么。

与其说是不知道,很多人会说“我只是忘记了那个时候在想什么而已。”所以为了不让自己忘记,应该把做过的事情用笔记记录下来。虽然有的时候你根本不了解这种记录有什么意义。

话说回来,在现实里仰望月空,经常会让人觉得它似乎充满了浪漫之色。

ACM模板整理

ACM

自用模板。

在做什么?

不得不承认Windows在图形界面的应用性上远远高于其他操作系统,并且由于种种原因,我无法抛弃Windows。但是对于开发者来说,Linux下的很多功能是比Windows方便的,并且可能开发出来的应用需要在Linux下测试。为了获得一个兼具两者优势的环境,我尝试了很多方案,包括虚拟机、双系统等,但是无论是哪种方案都有一定的缺陷,例如虚拟机性能不够,双系统切换不便。

在大约一年前,微软在Windows 10上推出了WSL (Windows Subsystem for Linux)功能,即可以在Windows环境下使用Linux系统的一些功能。这一功能使得我们可以在一定程度上抛弃庞大的虚拟机,直接运行Linux程序。

我在这一功能刚刚推出的时候就开始尝试使用了。到目前为止,WSL技术已经基本成熟,可以作为一个稳定的工作环境了。因此,我探索了一下优雅使用这一功能的方法。

正如标题所说,我目前正在使用ConEmu定制命令行的显示效果,WSL的系统是Ubuntu 16.04,shell使用zsh。这篇文章讲述的就是如何搭建这样一个环境。

效果

右键菜单
界面

MS17-010 (EternalBlue) 漏洞复现

测试环境

攻击者:kali Linux rolling

靶机:VirtualBox 中 Windows 7 SP1 Enterprise,未安装MS17-010补丁

建立虚拟网络环境

我们将要建立一个子网,把两台机器放在同一个子网中,模拟局域网环境。

  • 子网掩码:192.168.56/24
  • 攻击者IP:192.168.56.1
  • 靶机IP:192.168.56.101

新一年的感慨

最近又发生了很多事情,趁着还不是很晚,就说一说吧。

我希望每个人都能找到自己的存在方式,体现出自己的价值。形形色色的人共同构成了我们的社会,这其中有善于交际的,也有专注于自己的事业的;有能同时应付多人会话的,也有和一个人聊天时都不知道说什么的。

应该说,与人交流是一种能力,为什么有的人很难获得这种能力?我觉得,这是一种思想上的偏差,或者说是在特定环境下成长起来的人就会有的想法,这种想法限制了与人交流的能力,那就是:不希望自己给别人带来麻烦。

其实我想,大多数人并不在意其他人在交流的时候给自己带来了什么麻烦,只要不是太严重的话。所以,不敢交流的孩子还是要多给自己一点信心啊,大胆说出自己的想法。

最近我们班举行了两次投票,我的结果都不怎么样。我想,大概有两个原因。首先就是自己还是太弱了,大家并不认可我的能力和修养;第二就是自己比较招人讨厌,别人会想,“我上辈子是做了什么孽才会认识他”,大概就是这样。

前几天,我们学院开了一个“班长述职会”,从上午8:30开到下午1:30。说实话,这次会议的组织和内容糟糕到已经突破了我的下限。以前我会把水的报告会称为“PPT大赛”,因为个人展示不靠硬数据,全凭一张嘴加一个充满设计感和特效的PPT;然而这次,我觉得它连被称为PPT大赛的资格都没有。PPT是各班班长在开会前熬夜做的,内容都是靠夸大其词,开会过程各种低级趣味,更可笑的是,一场班长述职展示的活动还搞了个评分,请问你们是在评什么?班长的工作还是演讲的效果,亦或是PPT的设计?我早起没吃早饭,顶着小雨,骑车上山,就听了这场奇怪的评比,内容空洞我就不说了,就不能高效点吗?

霍金去世了,我觉得有个人说得好,“缅怀一个人不需要知道他具体有哪些贡献,只需要知道他有贡献就可以了”。实际上,大家不知道的只是他们具体的贡献,而这些人的精神我们是知道的,提到先烈,提到军人,提到教师,提到科学家,我们在这样说出他们身份的同时,实际上就已经给他们赋予了一种值得提倡和缅怀的精神。

在大一,我就说过要给行酱诚恳地道一次歉。已经拖了很久了,希望最近能写好吧,也能同时对我的高中生活做一次总结。

这个博客我也要重构了,经过多方面的考虑,我最后还是打算用前端技术实现,SEO友好。

经常看到各路大佬在空间中写一些他们的生活,在做的事情之类的,其实对我来说这些事情都没什么好炫耀的,我还有点瞧不起这种行为。不过现在想想,如果不向外界输出自己,怎么能让别人知道自己的能力呢?所以我今后可能也要发一些这样的东西,同时记录自己解决各种问题的方法发博客。

如果我还有什么事情没写,我可并不是忘了,我记得清楚着呢。不过,就先不写了吧。

Terra - 能登麻美子

这篇文章没有中文版本。如果您愿意提供翻译,请发送邮件至yuki@yuki-nagato.com

わたしは なにも 見ない

あなたが知ることのない 地中奥深くで 生きている

わたしは なにも 語らない

あなたが行くことのできない 深海の涯で 生きている

定められた虚空の抱擁に身を任せて

与えられた永遠の一片を 受け入れて

なんの条件も なんの束縛も ないままに

この星と交わした約束を ただ果たすために 

わたしは なにも 問わない

あなたが忘れかけている 空の彼方で 生きている

わたしは なにも 示さない

あなたが失いかけている 森のすべてで 生きている

積み上げられた過ちの重さを信じながら

求められる解答の数を疑いながら

たとえ小さな石でも 階段の一段となるように

たとえわずかな一滴も 大河のはじまりと なるように

それはこの鼓動から思うよりも遠くにあるだろう

それはこの血の流れから思うよりも近くにあるだろう

それはこの呼吸から思うよりも遠くにあるだろう

それはこの体温から思うよりも近くにあるだろう

わたしは 決して 奪わない

あなたが残してきた 時間の轍の一端で 生きている

わたしは 決して 殺さない

あなたが選ぶことのできない 道のどこかで 生きている

放(はな)たれた光は 闇を責めることはなく

闇もまた 光あるがゆえに在り続ける

形にとらわれず 名前に惑わされず

わずかな一点一点はただ線であり続ける

わたしは 決して 苦しめない

あなたと叶えようとしている 夢のつながりで 生きている

わたしは 決して 憎まない

あなたと必ず報われる 愛が生まれる場所で 生きている

なにもかもが無限であることを許されながら

命が  ただ有限である真実と向かい合い

「同じ」という希望と「違う」という希望で

終わることのない絶望をも きっと越えてゆける

わたしは 決して

关于梦想

我们曾经经常被问到,以后的梦想是什么。后来慢慢就没人问我们这个了,大概大家都觉得无趣,一个大人的梦想与别人有什么关系?成人有没有梦想都说不定。

但是不管怎样,有的人一直在向着自己曾经希望成为的样子做着努力,他们很早就对自己的生活做出了选择,那么也就很早就放弃了很多东西。这样究竟是好是坏,我不敢肯定,但是他们一定觉得自己的生活充满意义。

关于互联网的分享精神

我写这篇文章,其实是因为看一个人不爽,于是我仔细想了想究竟是哪里不对,然后把我的想法总结了一下。大概我对于一些违背精神的事情看不惯吧。

有人做了一个网站,是一个资源分享站。其实实质上就是用WordPress套模板加插件建的一个毫无美感的论坛,再加上过多的动画效果,导致访问者的体验非常差。那么这个资源分享站是怎样分享的呢?是那个人在服务器上放了一些种子,然后让别人注册。当然,注册之后这些资源也不会白给你,你还要充钱。那我觉得这个就太匪夷所思了,一个资源分享站,打着分享的旗号让别人买这些资源,还是BT资源。本来BT资源就是基于P2P协议的,它的存在就是为了让人能够免费自由的获得各种资源,把BT种子拿来买肯定是违背它固有的分享精神的,更何况这些资源都非原创,就是从网络上搜集的。

那个人说,他建站已经有一段时间了,但是还是没有达到他的预期。我想,他所说的预期,就是上万人注册,然后大家都掏腰包,从他那里买下本来都是免费的BT种子,他就只需坐地收钱,赚取大家的智商税。

我想我也不须多说什么,毕竟大家都会用脚投票。在互联网逐渐向去中心化发展的今天,这种反其道而行的中心化收费资源站也只能靠各种宣传和所谓的“优惠活动”来博得众人笑谈的一席之地了吧。

有很多人像我一样,还记得互联网的蛮荒时代。

还记得我们自称网虫,却要在网上冲浪。

还记得在那张毫无阻拦的网上,初代网民对世界抱有的那种单纯的好奇,而非现在,阿猫阿狗都想变成站在风口的猪。

还记得那个时代的精神,还记得一切都应该免费,一切都应该分享。知识是应该是免费的,而非现在,一本书都要花钱找人帮自己读。连wiki没看完就想着把自己那半瓶子水变现。

还记得互联网带给科技界的憧憬,和普通人的喜悦。

还记得,或记不得,一个又一个的分类的论坛,里边各路大神辛辛苦苦的码字。分享自己多年积累的下来的经验,而非建个收费群,分享强上西楼的感悟。

我们还记得,共享后面那个词是精神,而不是经济。

無題1

这篇文章没有中文版本。如果您愿意提供翻译,请发送邮件至yuki@yuki-nagato.com

自分は幽霊だ、と言う少女に出会ったのは××××ほど前のことだ。

私が彼女に名を問うと、彼女は「名前はありません」と答えた。「名前がないから、幽霊なのです。あなたも同じでしょう」そう言って少女は笑った。

そうだった。私も幽霊だったのだ。幽霊と会話できる存在がいるとしたら、その存在も幽霊なのである。今の私のように。

「それでは行きましょう」

彼女が言うので、私もついていく。少女の足取りは軽く、まるで生きているように見えた。どこへ行くのかと尋ねた私に、少女は足を止めて振り向いた。

不要猝死

已经快凌晨四点了,这时候睡觉意味着即使明天中午起,也只能睡8小时。

以后还是早点睡吧,毕竟猝死只有一次,要珍惜。

新年快乐

快到春节了。

最近看了Chinese New Year的纪录片,感觉很有感触。尤其是看着两个老外的时候。

总之,新年快乐!

avatar

長門有希

信息统合思念体

GitHub Logo Email Logo Atom Feed Logo

Do you like me?

本页还提供如下语言