Python进阶版：定义类时应用的9种最佳做法

本文转载自公众号“读芯术”(ID：AI_Discovery)。

作为一种OOP语言，Python通过支持以对象为主的各种功能来处理数据和功能。例如，数据结构是所有对象，包括原始类型(例如整数和字符串)，而在某些其他语言中，原始类型则不视为对象。对于另一个实例，函数是所有对象，它们仅仅是定义了其他对象的属性(例如类或模块)。

尽管可以使用内置数据类型，而且无需创建任何自定义类就能编写一组函数，但随着项目范围的扩大，代码可能会越来越难维护。这些单独代码部分的主题并不相同，尽管有很多信息是相关的，但管理它们之间的联系却并不简单。

在这些情况下，定义自己的类就很划得来了，这样一来你可以对相关信息进行分组并且改善项目的结构设计。而且由于你即将处理更少的分段代码，代码库的长期可维护性将得到改善。但要注意，仅当以正确方式完成类声明时，操作才可以实现，定义自定义类的益处才能超过管理它们的支出。

1. 好的命名

定义自己的类，就好比在代码库中添加了一位新成员。因此应该给类起个好名字。虽然类名的唯一限制是合法Python变量的规则(例如，不能以数字开头)，但是有一些好用的方法来命名类。

使用易于发音的名词。在参与团队项目时，这一点尤其重要。在小组演讲中，你恐怕不愿意这样讲：“在这种情况下，我们创建Zgnehst类的实例。” 另外，易于发音也意味着名称不应太长，使用三个以上的单词来定义类名简直无法想象。一个字是最佳，两个字其次，三个字不能再多啦!
反映其存储的数据和预期功能。就像在现实生活中一样——当看到男性化的名字时，我们就会默认这个孩子是男孩。同样的方式也适用于类名(或通常的任何其他变量)，命名规则很简单——不要让人感觉奇怪。如果要处理学生的信息，那么该课程应该命名为Student，KiddosAtCampus并不是一个常规的好名字。
遵循命名约定。应该对类名使用骆驼拼写法，例如GoodName。以下是非常规类名称的不完整列表：goodName，Good_Name，good_name以及GOodnAme。遵循命名约定是为了使意图表现明确。在别人阅读你的代码时，可以毫无疑问地假定命名为GoodName的对象是一个类。

也有适用于属性和功能的命名规则和约定，以下各节将在使用情况下简要提及，但是总体原理是相同的。

2. 显式实例属性

在大多数情况下，我们都想定义自己的实例初始化方法(即__init__)。在此种方法中，设置了新创建的类实例的初始状态。但是，Python并没有限制可以在何处使用自定义类定义实例属性。换句话说，你可以在创建实例之后的后续操作中定义其他实例属性。

classStudent: 
           def__init__(self, first_name, last_name): 
               self.first_name = first_name 
               self.last_name = last_name 
                 defverify_registration_status(self): 
               status = self.get_status() 
               self.status_verified = status =="registered" 
                 defget_guardian_name(self): 
               self.guardian ="Goodman" 
                 defget_status(self): 
               # get the registration status from a database 
               status =query_database(self.first_name, self.last_name) 
               return status

(1) 初始化方法

如上所示，可以通过指定学生的名字和姓氏来创建“学生”类的实例。稍后，在调用实例方法(即verify_registration_status)时，将设置“学生实例”的status属性。

但这不是理想的模式，因为如果在整个类中散布了各种实例属性，那么该类就无法明确实例对象拥有哪些数据。因此，最佳做法是将实例的属性放在__init__方法中，这样代码阅读器就可以通过单一位置来了解你的类的数据结构，如下所示：

classStudent: 
           def__init__(self, first_name, last_name): 
               self.first_name = first_name 
               self.last_name = last_name 
               self.status_verified =None 
               self.guardian =None

(2) 更好的初始化方法

对于最初无法设置的那些实例属性的问题，可以使用占位符值(例如None)进行设置。尽管没什么好担心的，但是当忘记调用某些实例方法来设置适用的实例属性时，此更改还有助于防止可能的错误，从而导致AttributeError(‘Student’ object has noattribute ‘status_verified’)。

在命名规则方面，应使用小写字母命名属性，并遵循蛇形命名法——如果使用多个单词，请在它们之间使用下划线连接。此外，所有名称都应对其存储的数据有具有意义的指示(例如first_name比fn更好)。

3. 使用属性——但要精简

Python进阶版：定义类时应用的9种最佳做法

图源：unsplash

有些人在具备其他OOP语言(例如Java)背景的情况下学习Python编码，并且习惯于为实例的属性创建getter和setter。可以通过在Python中使用属性装饰器来模仿这一模式。以下代码展示了使用属性装饰器实现getter和setter的基本形式：

classStudent: 
           def__init__(self, first_name, last_name): 
               self.first_name = first_name 
               self.last_name = last_name 
               @property           defname(self): 
               print("Getter for the name") 
               returnf"{self.first_name}{self.last_name}" 
               @name.setter           defname(self, name): 
               print("Setter for the name") 
               self.first_name, self.last_name = name.split()

(3) 属性装饰

创建此属性后，尽管它是通过内部函数实现的，我们仍然可以使用点符号将其用作常规属性。

>>> student =Student("John", "Smith") 
                ... print("StudentName:", student.name) 
                ... student.name ="JohnnySmith" 
                ... print("Aftersetting:", student.name) 
                ...                Getterfor the name                StudentName: JohnSmith                Setterfor the name                Getterfor the name

(4) 使用属性

使用属性实现的优点包括验证正确的值设置(检查是否使用字符串，而不是使用整数)和只读访问权限(通过不实现setter方法)。但应该同时使用属性，如果自定义类如下所示，可能会很让人分心——属性太多了!

classStudent: 
           def__init__(self, first_name, last_name): 
               self._first_name = first_name 
               self._last_name = last_name 
               @property 
           deffirst_name(self): 
               return self._first_name 
               @property 
           deflast_name(self): 
               return self._last_name 
               @property 
           defname(self): 
               returnf"{self._first_name}{self._last_name}"

(5) 滥用属性

在大多数情况下，这些属性可以用实例属性代替，因此我们可以访问它们并直接设置它们。除非对使用上述属性的好处有特定的需求(例如：值验证)，否则使用属性优先于在Python中创建属性。

4. 定义有意义的字符串表示法

在Python中，名称前后带有双下划线的函数称为特殊方法或魔术方法，有些人将其称为dunder方法。这些方法对解释器的基本操作有特殊的用法，包括我们先前介绍的__init__方法。__repr__和__str__这两种特殊方法对于创建自定义类的正确字符串表示法至关重要，这将为代码阅读器提供有关类的更直观信息。

它们之间的主要区别在于__repr__方法定义了字符串，你可以使用该字符串通过调用eval(repr(“therepr”))重新创建对象，而__str__方法定义的字符串则更具描述性，并允许更多定制。换句话说，你可以认为__repr__方法中定义的字符串由开发人员查看，而__str__方法中使用的字符串由常规用户查看。请看以下示例：

classStudent: 
           def__init__(self, first_name, last_name):               self.first_name = first_name               self.last_name = last_name                 def__repr__(self):               returnf"Student({self.first_name!r}, {self.last_name!r})" 
                 def__str__(self):               returnf"Student: {self.first_name}{self.last_name}"

字符串表示法的实现：

请注意，在__repr__方法的实现中，f字符串使用!r来显示带引号的这些字符串，因为使用格式正确的字符串构造实例很有必要。如果不使用!r格式，则字符串将为Student(John, Smith)，这不是构造“学生”实例的正确方法。

来看看这些实现如何为我们显示字符串：在交互式解释器中访问对象时会调用__repr__方法，而在打印对象时默认会调用__str__方法。

>>> student =Student("David", "Johnson") 
                 >>> student                 Student('David', 'Johnson') 
                 >>>print(student)                 Student: DavidJohnson

字符串表示法

5. 实例方法，类方法和静态方法

在一个类中，我们可以定义三种方法：实例方法、类方法和静态方法。我们需要考虑针对所关注的功能应使用哪些方法，以下是一些常规准则。

Python进阶版：定义类时应用的9种最佳做法

图源：unsplash

例如，如果方法与单个实例对象有关，那么需要访问或更新实例的特定属性。在这种情况下，应使用实例方法。这些方法具有如下签名：def do_something(self):，其中self自变量引用调用该方法的实例对象。

如果方法与单个实例对象无关，则应考虑使用类方法或静态方法。可以使用适用的修饰符轻松定义这两种方法：类方法(classmethod)和静态方法(staticmethod)。

两者之间的区别在于，类方法允许你访问或更新与类相关的属性，而静态方法则独立于任何实例或类本身。类方法的一个常见示例是提供一种方便的实例化方法，而静态方法可以只是一个实用函数。请看以下代码示例：

classStudent: 
    def__init__(self,first_name, last_name): 
       self.first_name = first_name 
       self.last_name = last_name 
               defbegin_study(self): 
        print(f"{self.first_name}{self.last_name} beginsstudying.") 
               @classmethod      deffrom_dict(cls,name_info):         first_name = name_info['first_name'] 
       last_name = name_info['last_name'] 
        returncls(first_name,last_name)             @staticmethod      defshow_duties():          return"Study,Play, Sleep"

不同的方法

也可以用类似的方式创建类属性。与前面讨论的实例属性不同，类属性由所有实例对象共享，并且它们应当反映一些独立于各个实例对象的特征。

6. 使用私有属性进行封装

在为项目编写自定义类时，需要考虑封装问题，尤其期望其他人也使用你的类的话就更应如此。当类的功能增长时，某些功能或属性仅与类内数据处理相关。换句话说，除了类之外，这些函数都将不会被调用，并且除你之外其他使用类的用户甚至不会在意这些函数的实现细节。在这些情况下，应该考虑封装。

按照惯例，应用封装的一种重要方法是为属性和函数加上下划线或两个下划线。二者之间有着细微的区别：带有下划线的被认为是受保护的，而带有两个下划线的被认为是私有的，这涉及在创建后进行名称处理。

从本质上来说，像这样命名属性和功能，是在告诉IDE(即集成开发环境，例如PyCharm)，尽管在Python中不存在真正的私有属性，但它们不会在类之外被访问。

classStudent: 
    def__init__(self,first_name, last_name): 
       self.first_name = first_name 
       self.last_name = last_name 
               defbegin_study(self): 
        print(f"{self.first_name}{self.last_name} beginsstudying.") 
               @classmethod      deffrom_dict(cls,name_info):         first_name = name_info['first_name'] 
       last_name = name_info['last_name'] 
        returncls(first_name,last_name)             @staticmethod      defshow_duties():          return"Study,Play, Sleep"

封装

上面的代码展示了一个简单的封装示例。如果想了解学生的评价GPA，那么我们可以使用get_mean_gpa方法获得GPA。用户不需要知道平均GPA的计算方式，我们可以通过在函数名称前添加下划线来保护相关方法。

这一最佳做法的主要收获是，与用户使用你的代码相关的公共API，仅公开最少的数量。对于仅在内部使用的那些代码，请将其设置为受保护的方法或私有方法。

Python进阶版：定义类时应用的9种最佳做法

图源：unsplash

7. 分离关注点和解耦

随着项目的发展，你会发现自己正在处理更多数据，如果你只坚持使用一个类会变得很麻烦。继续以“学生”类为例，假设学生在学校吃午餐，并且每个人都有一个餐饮帐户，可以用来支付餐费。从理论上讲，我们可以处理学生类中与帐户相关的数据和功能，如下所示：

classStudent: 
           def__init__(self, first_name, last_name, student_id): 
               self.first_name = first_name 
               self.last_name = last_name 
               self.student_id = student_id 
                 defcheck_account_balance(self): 
               account_number =get_account_number(self.student_id) 
               balance =get_balance(account_number)               return balance 
                 defload_money(self, amount): 
               account_number =get_account_number(self.student_id) 
               balance =get_balance(account_number)               balance += amount               update_balance(account_number, balance)

混合功能

上面的代码向展示了一些有关检查账户余额和向账户充值的伪代码，这两种伪代码都在Student类中实现。还有更多与该帐户相关的操作，例如冻结丢失的卡、合并帐户——实施所有这些操作会使“学生”类越来越大，从而使维护变得越来越困难。你应该分离这些职责并使学生类不负责这些与帐户相关的功能，即一种称为解耦的设计模式。

classStudent: 
           def__init__(self, first_name, last_name, student_id): 
               self.first_name = first_name 
               self.last_name = last_name 
               self.student_id = student_id 
               self.account =Account(self.student_id) 
                 defcheck_account_balance(self): 
               return self.account.get_balance() 
                 defload_money(self, amount): 
               self.account.load_money(amount) 
             classAccount:           def__init__(self, student_id): 
               self.student_id = student_id 
               # get additional information from the database 
               self.balance =400 
                 defget_balance(self): 
               # Theoretically, student.account.balance will work, but just in case 
               # we need to have additional steps to check, such as query the database 
               # again to make sure the data is up to date 
               return self.balance 
                 defload_money(self, amount): 
               # get the balance from the database 
               self.balance += amount 
               self.save_to_database()

分离关注点

上面的代码展示了我们如何使用附加的Account类来设计数据结构。如你所见，我们将所有与帐户相关的操作移至Account类。要实现检索学生的帐户信息的功能，学生类将通过从Account类中检索信息来处理。如果想实现更多与该类相关的功能，只需简单地更新Account类即可。

设计模式的主要要点是，希望各个类具有单独的关注点。通过将这些职责分开，你的类将变小，处理较小的代码组件会使将来的更改变得更容易。

8. 考虑使用__slots__进行优化

如果你的类主要用于存储数据的数据容器，那么可以考虑使用__slots__来优化类的性能。它不仅可以提高属性访问的速度，还可以节省内存，如果需要创建数千个或更多实例对象，就是它发挥大作用之处啦。

原因是，对于常规类，实例属性是通过内部托管的字典存储的。相比之下，通过使用__slots__，实例属性将使用在幕后使用C语言实现的与数组相关的数据结构存储，并且以更高的效率优化了它们的性能。

classStudentRegular: 
                    def__init__(self,first_name, last_name): 
                        self.first_name = first_name 
                        self.last_name = last_name 
             classStudentSlot:                    __slots__ = ['first_name', 'last_name'] 
                 def__init__(self,first_name, last_name): 
                        self.first_name = first_name 
                        self.last_name = last_name

在类的定义中使用__slots__

上面的代码展示了如何在类中实现__slots__的简单示例。具体来说，将所有属性列为一个序列，这将在数据存储中创建一对一匹配，以加快访问速度并减少内存消耗。如前所述，常规类使用字典进行属性访问，但不使用已实现__slots__的字典。以下代码证实了这一点：

>>> student_r =StudentRegular('John', 'Smith') 
                       >>>student_r.__dict__ 
                       {'first_name': 'John', 'last_name': 'Smith'} 
                       >>> student_s =StudentSlot('John', 'Smith') 
                       >>>student_s.__dict__ 
                       Traceback (most recentcall last):                         File"<input>", line 1, in <module> 
                       AttributeError: 'StudentSlot' object has noattribute '__dict__'

具有__slots__的类中没有__dict__

有关使用__slots__的详细讨论可以在Stack Overflow找到答案，你也可以从官方文档中找到更多信息(https://docs.python.org/3/reference/datamodel.html)。

需要注意，使用__slots__会有一个副作用——它会阻止你动态创建其他属性。有人建议将其作为一种控制类拥有的属性的机制，但这并不是它的设计初衷。

9. 文件

最后我们必须讨论一下类的文档。我们需要明白编写文档并不能替代任何代码，编写大量文档并不能提高代码的性能，也不一定会使代码更具可读性。如果必须依靠文档字符串来澄清代码，那么你的代码很可能有问题。

以下代码将向大家展示一个程序员可能犯的错误——使用不必要的注释来补偿错误的代码(即，在这种情况下，无意义的变量名)。相比之下，一些有好名字的好代码甚至不需要注释。

# how many billable hours 
        a =6 
        # the hourly rate 
        b =100 
        # total charge 
        c = a * b 
             # The above vs.the below with no comments 
             billable_hours =6 
        hourly_rate =100 
        total_charge = billable_hours * hourly_rate

失败解释案例

我并不是说反对写评论和文档字符串，这实际上取决于自己的实例。如果你的代码被多个人使用或多次使用(例如，你是唯一一个多次访问同一代码的人)，那么就应考虑编写一些好的注释。

Python进阶版：定义类时应用的9种最佳做法

这些注释可以帮助你自己或者团队伙伴阅读你的代码，但是他们都不可以假定你的代码完全按照注释中的说明进行。换句话说，编写好的代码始终是需要牢记的头等大事。

如果最终用户要使用代码的特定部分，那么需要编写文档字符串，因为这些人对相关的代码库并不熟悉。他们只想知道如何使用相关的API，而文档字符串将构成帮助菜单的基础。因此，作为程序员，你有责任确保提供有关如何使用程序的明确说明。

Python进阶版：定义类时应用的9种最佳做法

相关推荐