Python 网页抓取
Python 网页抓取 什么是网页抓取? 网页抓取是一种从几个网站中提取大量数据的技术。术语**“抓取”是指从另一个来源(网页)获取信息并将其保存到本地文件中。例如:假设你正在做一个名为“手机比较网站”**的项目,你需要手机的价格、收视率和型号名称来比较不同的手机。如果你通过查看各种网站来收集这些细节,将会花费很多时间。在这种情况下,网络废弃扮演了一个重要的角色,通过编写几行代码,你可以得到想要的 ...
Python 生成器
Python 生成器 什么是 Python 生成器? Python 生成器是返回遍历对象的函数,用于创建迭代器。它一次遍历整个项目。生成器也可以是语法类似于 Python 中列表推导的表达式。 在 Python 中创建迭代有很大的复杂性;我们需要实现 __iter__() 和 __next__() 方法来跟踪内部状态。 创建迭代器是一个漫长的过程。这就是为什么生成器在简化这一过程中起着至关重要的作 ...
Python 装饰器
Python 装饰器 装饰器是 Python 最有用和最强大的工具之一。这些用于修改函数的行为。装饰器提供了包装另一个函数的灵活性,以扩展包装函数的工作,而无需永久修改它。 在 Decorators 中,函数作为参数传递给另一个函数,然后在包装函数中调用。 它也被称为meta programming,程序的一部分试图在编译时改变程序的另一部分。 在理解装饰器之前,我们需要了解 Python 的 ...
pyspark.mllib
pyspark.mllib 机器学习是一种数据分析技术,它将数据与统计工具相结合来预测输出。这种预测被各种企业行业用来做出有利的决策。 PySpark 提供了一个名为 mllib 的机器学习 API。PySpark 的 mllib 支持各种机器学习算法,如分类、回归聚类、协同过滤和降维以及底层优化原语。下面给出了各种机器学习概念: 分类 pyspark.mllib 库支持多种分类方法,如二 ...
Python 栈和队列
Python 栈和队列 数据结构组织计算机中的存储,以便我们可以轻松地访问和更改数据。栈和队列是计算机科学中最早定义的数据结构。一个简单的 Python 列表也可以充当队列和栈。队列遵循先进先出规则,用于编程排序。栈和队列通常用数组或链表来实现。 堆 栈是遵循后进先出原则的数据结构。要实现栈,我们需要两个简单的操作: push - 它在栈顶增加一个元素。 pop - 它从栈顶部移除一个元素 ...
Python 命令行参数
Python 命令行参数 Python 支持可以在命令行上运行的程序,并带有命令行参数。它是执行脚本时需要传递给脚本的输入参数。 它意味着与脚本的命令行界面进行交互。 它提供了一个 getopt 模块,可以在其中解析命令行参数和选项。 What is argument passing? 命令 ls 通常用于获取特定目录中文件和文件夹的摘要。 为什么要使用 argparse? 它意味着程序的作者和用 ...
Python 数组
Python 数组 数组被定义为存储在连续内存位置的项的集合。它是一个可以容纳固定数量物品的容器,这些物品应该是同一类型的。数组在大多数编程语言中很流行,比如 C/C++、JavaScript 等。 数组是一种将多个相同类型的项存储在一起的思想,通过简单地在基值上添加一个偏移量,可以更容易地计算每个元素的位置。数组的组合可以通过减少代码的整体大小来节省大量时间。它用于在单个变量中存储多个值。如果您 ...
Python `sys`模块
Python sys模块 python sys模块提供了用于操作 python 运行时环境不同部分的函数和变量。它允许我们访问系统特定的参数和功能。 导入系统 首先,在运行任何函数之前,我们必须在程序中导入 sys模块。 sys模块 该函数提供已导入的现有 python 模块的名称。 sys.argv 该函数返回传递给 Python 脚本的命令行参数列表。脚本的名称始终是索引 0 处的项,其余的参 ...
Python `statistics`模块
Python statistics模块 Python statistics模块提供了对数值数据进行数理统计的功能。本模块中定义了一些流行的统计函数。 mean()函数 mean()函数用于计算列表中数字的算术平均值。 例 import statistics # list of positive integer numbers datasets = [5, 2, 7, 4, 2, 6, 8] ...
Python `random`模块
Python random模块 Python random模块函数依赖于伪随机数生成器函数 random(),该函数生成 0.0 到 1.0 之间的浮点数。 random模块中使用了不同类型的函数,如下所示: random.random() 该函数生成 0.0 到 1.0 之间的随机浮点数。 random.randint() 此函数返回指定整数之间的随机整数。 random.choice() 该函 ...