一些基础概念和学习资料: token:https://blog.csdn.net/weixin_43160662/article/details/136222440 prompt:https://www.quanzhan.co/archives/541 Lang-chain: 1)https://zhuanlan.zhihu.com/p/62052…
之前在Anaconda环境中配置了GPU版本的PyTorch虚拟环境,今天在将此环境加入Jupyter中的过程中遇到一些困难。以下是过程记录,搜集全网解决方案下来较为简洁的方法: 管理员身份打开Anaconda Prompt 激活虚拟环境: conda activate env_name 在虚拟环境中安装ipykernel,使用清华源能够安装成功:…
本文所指的回归模型为一般性的回归模型,不包含时间序列回归。时间序列回归模型一般要考虑稳定性(如Jenkins-box方法)和样本采样限制。 回归评价设定 设定n个样本,每个样本为 ,实际值为 ,预测值为 。 为 的平均值。 MAE 平均绝对误差(Mean Absolute Error),是对绝对误差损失的预期值。 MAPE 平均绝对百分比误差(Me…
GBDT(Gradient Boosting Decision Tree),全名叫梯度提升决策树,是一种迭代的决策树算法,它通过构造一组弱的学习器(树),并把多颗决策树的结果累加起来作为最终的预测输出。该算法将决策树与集成思想进行了有效的结合。本文对GBDT的调参思想和具体步骤进行一个整理。GBDT的超参数分为框架参数和弱学习器参数两类,以下分别讲…
马尔科夫链在城市规划领域有广泛的运用,马尔科夫链是一个随机过程,其中每个状态的出现只依赖于前一个状态。我们可以使用一系列数学公式来描述它。 定义 考虑一个离散时间、离散状态空间的随机过程{Xn},其中n是非负整数,表示时间,而Xn是在时间n的状态。如果对于所有的 n、所有的状态i,j,k,... 和所有的时间序列s1,s2,s3...sn-1,以下…
前言 这是一篇Scikit-Learn的学习笔记,主要有环境配置、基本模块和实际案例等内容。这篇文章中我会介绍一下我用机器学习做城市分析任务的基本思路。Scikit-Learn是一个用于构建机器学习模型的Python库,不仅提供了数十种基础机器学习算法,而且配备了数据预处理和模型评估工具。 Scikit-Learn介绍 安装方法 Scikit-Le…
前言 最近在做城市扩张相关的影响机制研究,要用到地理加权回归,趁此机会就顺便整理一下GWR相关的一些知识。 传统的OLS回归模型没有考虑到各样本之间的空间关系,得到的回归系数与样本的空间位置无关,回归结果是研究区域内的全局“平均值”。全局回归无法反应地理现象中的空间异质性。根据地理学第二定律(空间异质性定律):“空间的隔离,造成了地物之间的差异,即…
本文参考王劲峰老师的《地理探测器:原理与展望》,原文讲得非常详尽。本文结合自己的理解对GeoDetector的原理与功能进行了整理。 基本概念 1、空间统计学:以空间自相关为理论基础,突破了经典统计学的独立同分布假设前提。 2、空间统计学工具:空间自相关检验如Moran's I、半变异函数等;热点探测如Gi、LISA等;空间插值方法如Kriging…
本文将从“似然估计”和“最大”两个方面分别讲解。 一、似然估计 似然,likelihood,可以联想到另一个词,概率(probability)。这两个词在统计学中是完全不同的两个概念,这里我拿来进行一个对比: (1)概率 probability 所谓概率,是指某件事在指定的环境下发生的几率。 如在环境A下,事件M发生的几率为 P(M/A)。 在环境…