布隆过滤器和寻找嫌疑人布隆过滤器,听过也学过,实际中没怎么用到,时间长了再接触这个概念就陌生了,说到底还是没有彻底掌握。为了真正理解一项技术或一个概念,最好还是从问题出发,所以布隆过滤器到底解决了什么问题呢? 布隆过滤器可以用来检测一个元素是否属于某个集合。 上面的定义比较抽象,下面有些具体的例子(参考这篇文章的内容:https://zhuanlan.zhihu.com/p/94433082): 网页爬虫对 U 2024-01-27 系统设计 #系统设计 #布隆过滤器
详解匿名函数递归:从此能看懂天书代码最近在读《左耳听风》,里面提到了一个匿名函数递归的例子,觉得很有趣,但是我觉得书里讲解的还是有点难懂,所以尝试用自己的理解把这个问题重新讲了一遍。注:本文中所用的代码示例会同时使用JavaScript,Python语言。 让我们先来看下面这段代码: 12// javascript(f => f(f))(f => n => n == 0 ? 1 : n*f(f)(n-1)) 12 2024-01-18 函数编程 #函数编程 #递归 #匿名函数 #形参和实参 #高阶函数
《数学思维导论》书籍评分:⭐⭐⭐⭐ 如果你掌握的仅仅是工具,早晚有一天会被工具替代。 这是一本比较薄的小书,作者是写给那些大学新生,作为中学到大学的过渡课程。当然,任何对数学感兴趣的人都可以看一看,如果你有了一定的数学基础,应该很快就能翻完。 正如书名所言,作者无意讲述艰深的数学知识,主要是要传达一种数学思维和数学思想。书中涉及的数学知识确实比较简单,很多东西高中我们就学过了,但是背后的思想却不简单。作者介绍了 2021-11-24 读书笔记 #程序员 #数学 #人才
从物理转行到程序员,我最大的感触是这两个字敬、恒 曾国藩说: 敬字、恒字二端,是彻始彻终功夫。 冯唐说:真正的猛人要修炼“敬” “恒”。《冯唐成事心法》 2018年博士后出站,我加入了一家互联网公司,彻底告别物理,成为了一名程序员。转眼已经两年半有余。在整个转行的过程中,心路历程还是很复杂的。最近书中读到关于“敬”、“恒”的论述,发现这两个字非常适合用来概括我过去两年多的内心感触。 “敬”是敬天悯人,尊重常识和积累,不走捷径。 作为物 2021-05-15 程序人生 #成事 #《冯唐成事心法》
愉快地使用 Windows Terminal有了Windows Terminal 你再也不需要其他任何终端了…… 下载直接到Windows 10 自带的应用商店下载安装。参考: https://github.com/Microsoft/Terminal 配置ssh参考: https://blog.csdn.net/u012814856/article/details/100536762 Online GUID 生成网站: https://w 2020-05-23 工具之美 #Windows #Terminal
如何在 Windows 中搭建Spark环境参考链接: https://medium.com/big-data-engineering/how-to-install-apache-spark-2-x-in-your-pc-e2047246ffc3 安装JAVA目前scala只支持 java 8 和 java 11,可以选择其中一个版本进行下载。 https://www.oracle.com/java/technologies/javase- 2020-05-23 大数据 > Spark #Spark #Java #Scala
如何在本地调试你的 Spark Job生产环境的 Spark Job 都是跑在集群上的,毕竟 Spark 为大数据而生,海量的数据处理必须依靠集群。但是在开发Spark的的时候,不可避免我们要在本地进行一些开发和测试工作,所以如何在本地用好Spark也十分重要,下面给大家分享一些经验。 首先你需要在本机上安装好了Java,Scala和Spark,并配置好了环境变量。详情请参考官方文档或其他教程。 spark-shell本地运行Sp 2020-05-21 大数据 > Spark #Spark #Notebook
数据可视化工具合集CuteChattsGithub: https://github.com/cutecharts/cutecharts.py 特点可以绘制手绘风格的图标,如其名,很Cute。 2020-05-19 数据可视化 #python #可视化
如何用OpenWrite书写技术博客并在多平台分发最近发现一个用于编辑和多平台发布博客文章的工具OpenWrite,决定尝试一下使用这个工具书写技术博客。下面分享一下使用的心得。 首先OpenWrite目前只支持标准Markdown语言,Markdown用于书写文章非常方便,现在已经被广泛使用,但是Markdown的能力毕竟有限,对于写技术文章来说,可能有一些限制。技术文章除了常见的格式和排版要求之外,还有至少如下的需求: 代码显示 数学公式 2020-05-04 工具之美 > 写作 #Markdown
从零开始学AB测试:躲坑篇AB测试的原理很简单,只用到了最简单的统计假设检验,但表面的简单通常都隐藏着陷阱,这一点没有经过实践的摸爬滚打是不容易看到的,今天我就把前人已经踩过的坑,一共15个,给大家分享一下。在分享之前,大家脑中一定要有个概念,AB测试虽然简单且强大,但是其成立是有前提的: A组和B组的用户一定是要“随机”分配。随机这个事很有学问,绝对的随机甚至根本不可能,实际中只能做到尽量接近真随机。换句话说,随机性 2020-05-04 人工智能 > A/B测试