/images/avatar.png

秦时月

 明月几时有?
  把酒问青天。

HIMloco 文献阅读

核心概念与背景

标题拆解

论文题目是 《Hybrid Internal Model: Learning Agile Legged Locomotion with Simulated Robot Response》

  • Hybrid Internal Model (HIM,混合内部模型): 这是作者提出的新方法。“混合”指的是它不仅关注显式的速度跟踪,还关注隐式的稳定性 。
  • Agile Legged Locomotion (敏捷足式运动): 目标不是走得稳,而是要能跑、能跳、能爬楼梯,适应各种地形。
  • Simulated Robot Response (仿真机器人响应): 这是核心创新点。它不直接去“猜测”地形是什么样的(比如摩擦力多少、坡度多少),而是去“猜测”机器人遇到地形后会产生什么反应

为什么要做这件事?(痛点)

在足式机器人控制中,通常面临两个大难题:

Legged Gym 环境配置

日期:2025-11

系统环境:Ubuntu 22.04 LTS

显卡要求:NVIDIA 显卡(支持 CUDA >= 11.7)

核心组件:Isaac Gym (Preview 4) + RSL_RL (v1.0.2) + Legged Gym


基础环境准备

Ubuntu 22.04 默认系统库较新,而 Isaac Gym 较旧,因此必须严格锁定 Python 和 PyTorch 版本。

囚笼,以及那个超越逻辑的吻


读完《卡拉马佐夫兄弟》许久,许多人影都已模糊,唯有伊凡的身影始终清晰。

他是另一个拉斯柯尔尼科夫,是那种我总能在身上看到自己影子的同一种人。他们都习惯用理性解剖一切,却最终把刀刃对准了自己。这种精神困境,根植于智识上的骄傲——一种最终会为自己建起无形囚笼的骄傲。

机器学习笔记(6):神经网络


前言

   神经网络作为人工智能领域的核心分支,是一种旨在模拟生物神经系统结构与功能的计算范式。其根本目标在于构建能够从经验数据中自动学习复杂模式与潜在规律的计算模型,这标志着从传统基于规则的编程向数据驱动的自适应智能的根本性转变。
   神经网络的发展历程是理论突破与技术瓶颈交织的非线性过程。其理论基础可追溯至20世纪40年代 McCulloch 与 Pitts 对神经元的数学形式化,以及50年代 Rosenblatt 提出的“感知机”模型,这些早期工作奠定了连接主义(Connectionism)的基础。然而,由于 Minsky 与 Papert 在1969年深刻揭示了单层感知机的理论局限性(如无法解决XOR问题),该领域的研究一度陷入停滞。直至80年代,随着多层感知机及反向传播(Backpropagation)算法的重新发现与推广,神经网络才得以克服早期瓶颈,具备了表达非线性复杂函数的能力。尽管如此,诸如“梯度消失”等深度网络训练难题,使其在20世纪末的声誉再次被支持向量机(SVM)等统计学习方法所超越。
   进入21世纪,神经网络迎来了决定性的复兴。这一复兴并非源于单一突破,而是三大因素协同作用的结果:第一,以图形处理器(GPU)为代表的并行计算硬件提供了前所未有的算力支持;第二,互联网的普及带来了海量、高质量的标注数据集(Big Data);第三,算法层面的持续创新,包括新型激活函数(如ReLU)、优化策略及正则化技术,有效缓解了深度网络的训练困境。自2012年 AlexNet 在 ImageNet 竞赛中取得革命性成果以来,以深度神经网络(DNN)为核心的深度学习已成为人工智能研究与应用的主流范式。
   理解神经网络的意义至关重要,它不仅是实现图像识别、自然语言处理、语音识别等应用任务的关键技术,更代表了一种强大的特征表示学习(Representation Learning)框架。它驱动了从消费电子到自动驾驶、从金融科技到医疗诊断等众多领域的重大技术革新。因此,掌握神经网络的理论基础与实践方法,是理解并参与当前人工智能技术发展的核心要求。

Git 使用初探


引言

版本控制

  • 版本控制的必要性:在软件开发、文档撰写等项目中,我们经常需要追踪文件的每一次变更、回溯到历史版本,或与他人协同工作。传统的文件命名方式(如 report_v1.doc, report_v2.doc, report_final.doc)极易导致版本混乱、修改丢失和协作困难。版本控制系统(Version Control System, VCS)正是为解决这些难题而设计的专业工具。

机器学习笔记(5):决策树

基本概念

   决策树(Decision Tree) 是一种基础的监督学习模型,广泛应用于分类与回归任务。其核心思想是通过一个树状结构来对实例进行决策。该结构本质上是一系列if-then规则的集合,具有很强的可解释性。